Konvexné množiny v lineárnych priestoroch. Konvexné a konkávne funkcie

Úloha lineárne programovanie je hľadanie minima lineárnej funkcie f: n > 1 definovaná na nejakej uzavretej konvexnej množine vyznačujúca sa lineárnymi nerovnosťami.

Všeobecný problém lineárneho programovania vyzerá ako:

Vzhľadom na systém m lineárne rovnice a nerovnosti s n premennými

a lineárna funkcia F = c 1 x 1 + c 2 x 2 +… + c n x n min (max)

Systém (1) sa nazýva systém obmedzení a funkcia F sa nazýva lineárna funkcia, lineárny tvar, objektívna funkcia alebo cieľová funkcia.

Ešte stručnejšie spoločná úloha lineárne programovanie môže byť reprezentované ako:

x=(x|Axb, A=, b=( T )}

Problém lineárneho programovania je napísaný aj v iných formách – kanonickej a normálnej. Kanonická úloha je označenie Zk, nazvime ju takto:

x=(x|Axb, ?0, j=))

Normálnym problémom je zápis Zn, nazvime ho

x=(x|Axb, ?0, j=))

Konvexné množiny a funkcie

Definícia konvexnej množiny: množina je - - konvexná, ak množina spolu s ľubovoľnými dvoma bodmi obsahuje všetky body úsečky spájajúcej bod s bodom v priestore.

Nasledujúci obrázok ukazuje dve sady v rovine, jedna je konvexná a druhá nie.

Ryža. 1

Konvexné v priestore sú napríklad také množiny: celý priestor, jeho kladný oktant a nezáporný oktant, ľubovoľná guľa, otvorená aj zatvorená, ľubovoľná nadrovina (daná nejakou rovnicou tvaru, ako aj otvorená a uzavretá polovica -medzery, dané, respektíve podmienkami a.

Medzi bodmi konvexnej množiny je možné vyčleniť vnútorné, hraničné a rohové body.

Bod množiny sa nazýva vnútorný, ak niektoré jej okolie obsahuje body len tejto množiny.

Bod množiny sa nazýva hranica, ak niektoré z jeho okolia obsahuje body, ktoré do danej množiny patria, aj body, ktoré do nej nepatria.

Rohové body sú obzvlášť zaujímavé v problémoch lineárneho programovania. Bod zostavy je tzv hranatý(alebo extrém), ak nie je interný pre žiadny segment, ktorý úplne patrí do danej množiny.

Na obr. príklady rôzne body polygón: vnútorný (bod M), hraničný (bod N) a rohový (body A, B, C, D, E). Bod A je uhlový, pretože pre akýkoľvek segment, ktorý celý patrí do mnohouholníka, napríklad segment AP, nie je vnútorný; bod A je vnútorný segmentu KL, ale tento segment nepatrí celý do polygónu.

Pri konvexnej množine sa rohové body vždy zhodujú s vrcholmi mnohouholníka (mnohostenu), pričom pri nekonvexnej množine to nie je potrebné. Množina bodov sa nazýva uzavretá, ak obsahuje všetky jej hraničné body. Súbor bodov sa nazýva obmedzené, ak je v ktoromkoľvek bode množiny sústredená guľa (kruh) s polomerom konečnej dĺžky, ktorá celú množinu obsahuje; inak sa množina nazýva neohraničená. Konvexná uzavretá množina bodov roviny s konečným počtom rohové body, sa volá konvexný mnohouholník, ak je ohraničená, a konvexná polygonálna oblasť, ak je neohraničená.

Funkcia f: sa nazýva konvexná, ak jej epigraf epi f= je konvexná množina. Na obrázku je znázornená konvexná funkcia, jej graf je zvýraznený modrou farbou a nadgraf je zafarbený zelenou farbou.

Funkcia f: sa nazýva uzavretá, ak jej epigraf je uzavretá množina.

Geometrický význam riešení nerovníc, rovníc a ich sústav

Uvažujme o riešeniach nerovností.

Výrok 1. Množina riešení nerovnice s dvoma premennými a11x1+a12x2<=b1 является одной из двух полуплоскостей, на которые вся плоскость делится прямой a11x1+a12x2=b1, включая и эту прямую, а другая полуплоскость с той же прямой есть множество решений неравенства a11x1+a12x2>=b1.

Na určenie požadovanej polroviny (hornej alebo dolnej) sa odporúča nastaviť ľubovoľný kontrolný bod, ktorý neleží na jej hranici - zostrojená čiara. Ak je nerovnosť splnená v riadiacom bode, potom je splnená aj vo všetkých bodoch polroviny obsahujúcej riadiaci bod a nie je splnená vo všetkých bodoch druhej polroviny. A naopak, ak nerovnosť nie je splnená v riadiacom bode, nie je splnená vo všetkých bodoch polroviny obsahujúcej riadiaci bod a je splnená vo všetkých bodoch druhej polroviny. Ako kontrolný bod je vhodné vziať počiatok súradníc O (0; 0), ktorý neleží na zostrojenej priamke.

Zvážte súbor riešení systémov nerovností.

Výrok 2. Množina riešení kĺbovej sústavy m lineárne nerovnosti s dvoma premennými je konvexný mnohouholník (alebo konvexná mnohouholníková oblasť).

Každá z nerovností v súlade s tvrdením 1 definuje jednu z polrovín, čo je konvexná množina bodov. Množina riešení spoločnej sústavy lineárnych nerovníc sú body, ktoré patria do polrovín riešení všetkých nerovníc, t.j. patria k ich priesečníku. Podľa vyhlásenia o križovatke konvexné sady táto množina je konvexná a obsahuje konečný počet rohových bodov, t.j. je konvexný mnohouholník (konvexná mnohouholníková oblasť).

Súradnice rohových bodov - vrcholy mnohouholníka nájdeme ako súradnice priesečníkov príslušných čiar.

Pri konštrukcii oblastí riešení pre sústavy nerovníc môžu nastať aj iné prípady: množina riešení je konvexná polygonálna oblasť (obr. a); jeden bod (obr. b); prázdna množina, keď je systém nerovností nekonzistentný (obr. c).

Definovanie konceptu duality pomocou Legendrovej transformácie

Nech f:. Funkcia f*: definovaná rovnosťou f*(x*)==(x*) sa nazýva pridružená funkcia k f a funkcia f**: definovaná pravidlom f**(x*)==( x*) sa nazýva druhá pridružená funkcia k f.

Mapovanie f* (x*) =< x*, x>? f(x) sa nazýva Legendreova transformácia.

Zvyčajná technika konštrukcie duálneho problému je nasledovná. Problém s minimalizáciou

kde X je lineárny priestor, je zahrnutý do triedy problémov, ktoré sú mu podobné, v závislosti od parametra:

kde Y je nejaký iný lineárny priestor, F (x, 0)=f(x) (funkcia F sa nazýva perturbácia f). Zvyčajne sa predpokladá, že F je konvexné. Duál problému vzhľadom na danú poruchu sa nazýva. úloha

kde F* je funkcia duálna (konjugovaná) k F v zmysle Legendre - Young - Fenchel. Takáto dualita nám umožňuje priradiť ku každej konvexnej funkcii f: X-> R duálny objekt – pridruženú funkciu definovanú na duálnom priestore X* a definovanú vzorcom

Pre najjednoduchšie problémy konvexného programovania ako

kde X je lineárny priestor, konvexné funkcie na X, B-konvexná súprava v X (špeciálne prípady (3) sú problémy lineárneho programovania) sa zvyčajne používajú nasledujúce štandardné poruchy v závislosti od parametrov y=(y 1 ,…, y m), m, Vety o dualite pre všeobecné triedy problémov konvexného programovania že za určitých predpokladov sa na poruche F hodnoty problémov (2) a (2*) zhodujú a navyše riešením jedného z problémov je Lagrangeov multiplikátor pre druhý.

Pri skúmaní ekonomické javy matematické metódy taká vlastnosť mnohých množín a funkcií, ako je konvexnosť, sa ukazuje ako veľmi významná. Charakter správania mnohých ekonomických objektov je spôsobený tým, že určité závislosti popisujúce tieto objekty sú konvexné.

Existencia alebo jedinečnosť riešenia je často spojená s konvexnosťou funkcií a množín ekonomické úlohy: Mnohé výpočtové algoritmy sú založené na rovnakej vlastnosti.

Platnosť mnohých tvrdení týkajúcich sa konvexných množín a funkcií je celkom jasná, sú takmer zrejmé. Ich dokazovanie je zároveň často veľmi náročné. Preto tu budú uvedené niektoré základné fakty súvisiace s konvexnosťou bez dôkazov, počítajúc s ich intuitívnou presvedčivosťou.

Konvexné sady v rovine.

akýkoľvek geometrický obrazec na rovine možno považovať za množinu bodov patriacich tomuto obrázku. Niektoré množiny (napríklad kruh, obdĺžnik, pásik medzi rovnobežnými čiarami) obsahujú vnútorné aj hraničné body; iné (napríklad úsečka, kružnica) pozostávajú len z hraničných bodov.

Množina bodov v rovine sa nazýva konvexná, ak má nasledujúcu vlastnosť: segment spájajúci ľubovoľné dva body tejto množiny je úplne obsiahnutý v tejto množine.

Príklady konvexných množín sú: trojuholník, úsečka, polrovina (časť roviny ležiaca na jednej strane priamky), celá rovina.

Množina pozostávajúca z jedného bodu a prázdna množina bez bodov sa podľa konvencie tiež považuje za konvexnú. V každom prípade v týchto množinách nie je možné nakresliť úsečku, ktorá spája niektoré body týchto množín a nepatrí do týchto množín úplne - vo všeobecnosti nie je možné v nich vybrať dva body. Preto ich zahrnutie do počtu konvexných množín nepovedie k rozporu s definíciou a to stačí na matematické uvažovanie.

Križovatka, t.j. spoločná časť dve konvexné množiny sú vždy konvexné: ak vezmeme ľubovoľné dva priesečníky (a sú spoločné, to znamená, že patria do každej z pretínajúcich sa množín) a spojíme ich úsečkou, ľahko zistíme, že všetky body úsečky sú spoločné do oboch množín, teda ako je každá z nich konvexná. Priesečník ľubovoľného počtu konvexných množín bude tiež konvexný.

Dôležitou vlastnosťou konvexných množín je ich oddeliteľnosť: ak dve konvexné množiny nemajú spoločné vnútorné body, potom môže byť rovina rezaná pozdĺž priamky tak, že jedna zo sád bude celá ležať v jednej polrovine a druhá v druhej (body oboch sád môžu byť umiestnené na čiare rezu). Priama čiara, ktorá ich oddeľuje, sa v niektorých prípadoch ukazuje ako jediná možná, v iných nie.

Samotný hraničný bod ktorejkoľvek konvexnej množiny možno považovať za konvexnú množinu, ktorá nemá spoločné vnútorné body s pôvodnou množinou, preto môže byť od nej oddelená nejakou priamkou. Čiara oddeľujúca jej hraničný bod od konvexnej množiny sa nazýva nosná línia tejto množiny v danom bode. Referenčné čiary v niektorých bodoch obrysu môžu byť jedinečné, v iných nie jedinečné.

Zaveďme sústavu kartézskych súradníc x, y v rovine. Teraz máme možnosť považovať rôzne obrazce za množiny takých bodov, ktorých súradnice spĺňajú určité rovnice alebo nerovnice (ak súradnice bodu spĺňajú akúkoľvek podmienku, pre stručnosť povieme, že túto podmienku spĺňa aj samotný bod).

Množina AÌE sa nazýva konvexná, ak spolu s ľubovoľnými dvoma bodmi x 1 a x 2 obsahuje úsečku, ktorá ich spája, t.j. sady formulára

[X 1 X 2 ]={XОE n | X=l X 1+ (1-l) X 2, 0 £ l £ 1).

Vyššie uvedené polovičné medzery sú konvexné množiny. Skontrolujme napríklad, či je polpriestor H + ab ( XОE n | ³b). Ak to chcete urobiť, zvážte dva ľubovoľné body X 1 a X 2 tohto polovičného priestoru. Tieto body uspokojujú nerovnosti

X 1 >³ b, X 2 >³ b.

Pridajme tieto dve nerovnosti, pričom prvú predbežne vynásobíme ľubovoľným číslom lО a druhú 1-l. Výsledkom je, že dostaneme nerovnosť

l X 1 > + (1-l) X 2 > = X 1 + (1-l) X 2 >³ b.

Keďže l je ľubovoľné, celý segment spájajúci zvolené body patrí do daného polpriestoru. Polpriestor je teda skutočne konvexná množina.

2.10 konvexné (a), nekonvexné (b) množiny.

Kapitola 3 Základy funkcií.

3.1 Pojem funkcií.

Nech X a Y sú dve množiny. Ak je zadané pravidlo, podľa ktorého je každý prvok množiny X spojený s určitým prvkom množiny Y, potom hovoria, že funkcia je daná f, mapovanie X na Y. Táto skutočnosť sa zapíše ako f: X®Y alebo y=f(x), kde x ОX, yОY. Množina X sa nazýva dátová oblasť alebo oblasť definície funkcie a množina Y je množina hodnôt. Funkcia f(x) je pravidlo, ktoré umožňuje priradiť každú hodnotu x jediný význam y=f(x). V tomto prípade je x nezávislá premenná a y je závislá premenná. Funkcie y=f(x)=f(x 1 +x 2 ,..,x n), t.j. volajú sa funkcie s doménou X Ì E n a množinou hodnôt Y Ì E numerické funkcie na rozdiel od vektorových funkcií, pre ktoré YÌ E m , m>1.

Veľa druhu

((x,y)нE n +1 ½ y=f(x) pre niektoré xнX)

nazývaný graf funkcie y=f(x).

riadok fyzikálnych procesov možno opísať s spojité funkcie, t.j. funkcie, ktoré majú vlastnosť spojitosti v každom bode x patriacom do ich definičných domén.

Funkcia f sa nazýva spojitá v bode x 0 нX, ak pre ľubovoľné číslo e>0 možno zadať číslo d e >0 tak, že pre všetky xнX Ç Ède 1x 0 1 nerovnosť ½f(x)-f(x 0)1

Ako príklady funkcií spojitých na E n uvádzame lineárnu funkciu f 1 (x)= +b=c 1 x 1 +c 2 x 2 +..+c n x n +b a kvadratická funkcia f 2 (x)=1/2 ++b,

kde Q je numerická symetrická matica veľkosti n * m, c je nejaký vektor z E n a b je nejaké číslo a Qx znamená súčin matice vektorom podľa pravidiel násobenia matíc prijatých v lineárnej algebre.

3.2 Klasifikácia funkcií.

3.2.1 Diskontinuálne a diskrétne funkcie.

V inžinierskych aplikáciách nie je nezvyčajné používať

diskontinuálne funkcie. Napríklad náklady na hlásenie množstva do nejakého systému

tepla pri rôznych teplotách systému, získame po častiach súvislú krivku (obr. 3.1). existujú prípady, keď premenná nadobúda diskrétne hodnoty (obrázok 3.2).

V závislosti od toho, či je skúmaná funkcia kontinuálna alebo diskontinuálna, by sa mali použiť rôzne metódy výskumu. Treba poznamenať, že metóda, ktorá je účinná pri analýze spojitých funkcií, sa môže ukázať ako neúčinná pri štúdiu nespojitých funkcií, hoci nie je vylúčený opak.

Funkcie možno klasifikovať aj podľa ich tvaru, ktorý určuje topologické vlastnosti funkcií v uvažovanom intervale.

3.2.2 Monotónne funkcie.

Funkcia f(x) je monotónna (obrázok 3.3) s rastúcou aj klesajúcou hodnotou), ak pre dva ľubovoľné body x 1 a x 2 také, že x 1 f(x 1) £ f(x 2) (monotónne rastúca funkcia)
f(x 1)³ (x 2) (monotónne klesajúca funkcia)

Obr.3.3. O koncepte monotónnej funkcie.

Obrázok 3.4 ukazuje graf funkcie, ktorá monotónne klesá pri x£0 a monotónne rastie pri x30. Funkcia dosiahne svoje minimum v bode x=x * (počiatok 0) a je monotónna na oboch stranách bodu minima. Takéto funkcie sa nazývajú unimodálne. Všimnite si, že unimodálna funkcia nemusí byť vôbec hladká (obr. 3.4, a) a dokonca spojitá (obr. 3.4, b), môže byť zlomená (nediferencovateľná), nespojitá (obr. 3.4, c), diskrétne (obr. 3.4 d) a v niektorých intervaloch dokonca nemusia byť definované (obr. 3.4, e.).

Takže funkcia f(x) sa na segmente nazýva unimodálna, ak je súvislá a existujú čísla a a b a£a£b£b také, že:

1) ak a

2) ak b

3) pre xn f(x)=f* =min f(x);

Obr.3.4 Unimodálne funkcie: a) hladké, b) spojité, c) nespojité, d) diskrétne, e) ľubovoľné.

je možné degenerovať do bodu jeden alebo dva zo segmentov , , (obrázok 3.5).

Obr.3.5. Varianty usporiadania a degenerácie až po segmenty monotónnosti a stálosti unimodálnej funkcie.

množinu funkcií, ktoré sú na segmente unimodálne, budeme označovať Q. Unimodalita funkcií je mimoriadne dôležitá vlastnosť, ktorá sa široko používa v optimalizačných štúdiách.

3.2.3 Konvexné, pseudokonvexné a kvázikonvexné funkcie.

Konvexné funkcie a ich zovšeobecnenia (pseudokonvexné a kvázikonvexné funkcie) zohrávajú dôležitú úlohu v teórii optimalizácie. Tieto funkcie budú použité na formulovanie dostatočných podmienok optimality.

Číselná funkcia f definovaná na konvexnej množine X, XÌE n sa nazýva konvexná, ak pre ľubovoľné dva body x 1 ,x 2 нX a ľubovoľné číslo lн nerovnosť

f(lx 1 +(1-1)x 2) £lf(x 1)+(1-1)f(x 2). (3.1)

Nerovnosť opačného zmyslu definuje konkávnu funkciu a často sa používajú výrazy „konvexný nadol (1)“ „konvexný nahor (2)“ (obrázok 3.6).

Obr.3.6. 1) Konvexná (konvexná dole) funkcia, 2) Konkávna (konkávna nahor) funkcia.

Geometricky konvexnosť funkcie f znamená, že žiadny bod ľubovoľnej tetivy grafu f nie je umiestnený nižšie ako príslušný bod samotného grafu (leží pod tetivou spájajúcou dva body jeho grafu) (obrázok 3.6. , Krivka 1).

Najjednoduchšími príkladmi konvexných funkcií jednej premennej sú parabola y=x 2 a exponent y=e x . Funkcie y=-x 2 a y=-e x sú konkávne.

Ak pre všetky x 1, x 2 ОX x 1 ¹x 2 a lО nerovnosť (3.1) platí prísne (<), то f называется prísne konvexné na X (obrázok 3.7, a). Funkcia sa volá (prísne) zakrivený , ak - f je (striktne) konvexné (obr. 3.7, b).

Obr.3.7. Striktne konvexné (a) a striktne konkávne funkcie, ich deriváty (bodkovaná čiara) a funkcia, ktorá má lineárny rez

Funkcia f(x), definovaný na konvexnej množine X, sa nazýva silne konvexné s konštantou l> 0 ak

Podajme geometrickú interpretáciu definície (3.2) uvažovaním funkcie

y=f(x) jedna premenná. Upevnenie X 1 a X 2 z definičného oboru funkcie a označujúci , zmeníme l z 0 na 1. Je jasné, že potom hodnota x(l), sa zmení z x 1 predtým x 2 a bod ( X, f(x)) prejde cez graf funkcie y=f(x) z bodu B= ( x2, f(x2)) až k veci ALE= (x 1, f(x 1))(obr.3.8).

Obr.3.8. Graf silne konvexnej funkcie.

Rovnice

v rovine xOy opíšte priamku L(sekant) spájajúci body ALE a AT a rovnice

nastaviť parabolu R milý , ktorý prechádza cez body ALE a AT. Nerovnosť (3.2) v tomto prípade znamená, že graf funkcie y = f(x) na rovine xOy sa nachádza pod nielen sečnicou spájajúcou body ALE a AT, ale aj paraboly Р, ktorej výchylka je určená parametrom l a môže byť zvolený ľubovoľne malý. Inými slovami, v oblasti ohraničenej sečnicou a grafom funkcie môžete postaviť parabolu spájajúcu body ALE a AT.

· Veta 3.1 Plynule diferencovateľná funkcia na konvexnej množine X f je na tejto množine konvexná vtedy a len vtedy, ak pre nejakú x 1 , x 2 О X skutočná nerovnosť

f(x 2) ³ f(x 1) +<Ñf(x 1 ,x 2 -x 1)>, (3.3)

získané z rozkladu funkcie f(x) v Taylorovom rade v bode x 1 odstránením podmienok druhého a vyššieho rádu expanzie

F(x 1 + h) = f(x 1) + hf ¢(x 1) + h 2 /2*f¢¢(x 1) +..., (3.3)

kde h je dostatočne malé číslo, |h|

Ñf(x 1) = (¶f/¶x 1 , ¶f/¶x 2 ,.., ¶f/¶x n) m,

tie. je vektor parciálnych derivácií prvého rádu vypočítaný v bode x 1 a nazýva sa gradient funkcie f v bode x 1 .

· Veta 3.2 Nech je funkcia f dvakrát spojito diferencovateľná na konvexnej množine X, ktorá obsahuje aspoň jeden vnútorný bod, a nech m 2 f(x) je jej Hessián. Potom pre konvexnosť f na množine X je potrebné a postačujúce, aby matica m 2 f(x) bola nezáporne definitná pre všetky xnX, t.j. k nerovnosti

<Ñ 2 f(x)h, h>³0 (3,4)

platí pre všetky body xнX, hнE n . Tu sa číselná matica Ñ 2 f(x) nazýva hessiánska (alebo hessovská matica). Ak má funkcia f v bode x 1 spojité parciálne derivácie druhého rádu (dvakrát spojito diferencovateľné), potom je v bode x 1 dvakrát diferencovateľná a má Hessovu maticu v tvare

táto matica je navyše symetrická, t.j.

Podobné tvrdenia platia aj pre konkávne funkcie. V tomto prípade by sa vo vzorcoch (3.2) a (3.4) mal znak nerovnosti ³ nahradiť £.

Kontrola konvexnosti funkcie.

Funkcia f je konvexná, ak je jej Hessova matica kladne definitná (>0) alebo kladne semidefinitívna pre všetky hodnoty x 1 , x 2 ,..,x n.

Kontrola konvexnosti funkcie.

Funkcia f je konvexná, ak jej Hessova matica je záporná semidefinitná (£0) pre všetky x 1 , x 2 ,.., x n .

Striktne konvexná alebo konkávna funkcia má jeden extrém, ktorým je globálne minimum alebo maximum. Funkcia, ktorá má lineárny rez (obrázok 3.7, c), má nekonečný počet extrémov rovnakej veľkosti.

Na posúdenie jednej extrémnosti za prítomnosti obmedzení možno použiť koncept konvexnosti prípustnej množiny. Množina je konvexná, ak ktorýkoľvek segment priamky spájajúcej dva body hraníc množiny leží celý vo vnútri množiny.

Konvexnosť alebo konkávnosť účelovej funkcie možno posudzovať aj podľa charakteru zmeny jej parciálnych derivácií ¶f/¶x. V prípade striktne konvexnej funkcie sa táto derivácia zväčšuje so zvyšujúcim sa argumentom (obr. 3.7 a) a pri striktne konvexnej funkcii klesá (obr. 3.7 b). Ak existuje lineárny segment účelovej funkcie, indikovaná derivácia na tomto segmente je konštantná.

Konvexná sada formulára

X=(xnE n ) | Ax£b)=(xnE n | £b i, i=1,..,m)

kde A je nejaká matica m*n s riadkami a 1 ,..,a m , b=(b 1 ,..,b m) н E n (m=1,2,..). Je zvykom nazývať mnohosteny alebo jednoducho mnohosteny. Mnohosten je teda množina riešení nejakého systému konečného počtu lineárnych nerovností, alebo, čo je to isté, priesečníku konečného počtu polpriestorov (obrázok 3.9).

Obr.3.9. Polyedrická súprava (mnohosten).


Napríklad polygón na obr. 2.1 je a konvexné a mnohouholník na obr. 2.1, b nie je konvexné (nachádza sa na oboch stranách priamky BC).

Všeobecnou definujúcou vlastnosťou, ktorá odlišuje konvexný mnohouholník od nekonvexného, ​​je, že ak zoberiete ľubovoľné dva jeho body a spojíte ich so segmentom, celý segment bude patriť tomuto mnohouholníku. Túto vlastnosť možno chápať ako definíciu konvexnej množiny bodov.

Množina bodov sa nazýva konvexná, ak spolu s ľubovoľnými dvoma bodmi obsahuje celý segment spájajúci tieto body.

Podľa tejto definície je polygón na obr. 2.1 je a konvexná množina a mnohouholník na obr. 2.1, b nie je taký, pretože segment WE medzi jeho dvoma bodmi M a / V nepatrí úplne do tohto mnohouholníka.

Nech M a N sú ľubovoľné dva priesečníky dvoch množín A a B (obr. 2.3). Keďže body M a N patria do priesečníka množín, t.j. aj konvexná množina A aj konvexná množina B, potom podľa definície konvexnej množiny budú všetky body úsečky MI patriť do množiny A aj do množiny B, t.j. priesečník týchto množín. A to znamená, že priesečník týchto množín je konvexná množina. ■

Medzi bodmi konvexnej množiny je možné vyčleniť vnútorné, hraničné a rohové body.

Bod množiny sa nazýva vnútorný, ak niektoré z jeho okolia obsahuje body iba tejto množiny.

Obr- 2-3 Bod množiny sa nazýva hranica,

ak niektoré z jeho okolia obsahuje body, ktoré do danej množiny patria, aj body, ktoré do nej nepatria.

Rohové body sú obzvlášť zaujímavé v problémoch lineárneho programovania.

Bod množiny sa nazýva rohový (alebo krajný) bod, ak nie je vnútorným žiadnemu segmentu, ktorý úplne patrí do danej množiny.


Na obr. 2.4 sú uvedené príklady rôznych bodov mnohouholníka: vnútorný (bod M), hraničný (bod I) a rohový (body A, B, C, D E). Bod A je uhlový, pretože pre akýkoľvek segment, ktorý celý patrí do mnohouholníka, napríklad segment AP, nie je vnútorný; bod A je vnútorný segmentu Kb, ale tento segment nepatrí celý do polygónu.

Pri konvexnej množine sa rohové body vždy zhodujú s vrcholmi mnohouholníka (mnohostenu), pričom pri nekonvexnej množine to nie je potrebné. Takže na obr. 2,5 bod A je vrcholom nekonvexného mnohouholníka, nie však rohového (je vnútorným segmentom Kb, ktorý celý patrí tomuto mnohouholníku).

Množina bodov sa nazýva uzavretá, ak obsahuje všetky jej hraničné body. Množina bodov sa nazýva ohraničená, ak existuje guľa (kruh) s polomerom konečnej dĺžky so stredom v ľubovoľnom bode množiny, ktorá úplne obsahuje danú množinu; inak sa množina nazýva neohraničená.

Ak je obrazec obmedzený iba na priame čiary alebo ich segmenty, potom je počet jeho rohových bodov konečný; v prípade krivočiarych hraníc obrázok obsahuje nekonečne veľa rohových bodov, čo nám umožňuje urobiť nasledujúcu definíciu.

Konvexná uzavretá množina bodov v priestore (rovine), ktorá má konečný počet rohových bodov, sa nazýva konvexný mnohosten (polygón), ak je ohraničený, a konvexná mnohostenná (polygonálna) oblasť, ak je neobmedzená.

Doteraz sme uvažovali konvexné množiny bodov v rovine a v priestore. Analyticky sú takéto body reprezentované usporiadanou dvojicou čísel (xx x2) alebo usporiadanou trojicou čísel (*1, *2, *h). Pojem bod môže byť zovšeobecnený, teda bodom (alebo vektorom). ) usporiadaná množina n čísel ., xn), v ktorej sa čísla xx, x2, ..., xn nazývajú súradnicami bodu (vektora). Takéto zovšeobecnenie dáva zmysel, keďže ak vezmeme akýkoľvek ekonomický objekt, tak na jeho charakterizáciu dve alebo tri čísla väčšinou nestačia a je potrebné vziať n čísel, kde n > 3.

Množina všetkých bodov X = (xx x2,..., xn) je n-rozmerný bodový (vektorový) priestor. Pre n > 3 nemajú body a postavy n-rozmerného priestoru žiadny skutočný geometrický význam a všetky štúdie objektov v tomto priestore sa musia vykonávať v analytickej forme. Napriek tomu sa v tomto prípade ukazuje ako účelné použiť geometrické pojmy uľahčiť predstavy o objektoch „-rozmerného priestoru.

III. Konvexné sady a funkcie 569

3. Všetky funkcie jednej premennej s konštantnou elasticitou ω majú tvar (8) (použite rovnosť (4)).

4. Funkcie viacerých premenných s konštantnými čiastočnými elasticitami sú mocninnými funkciami formy

y = Ax1B1x2B2,...,xN BN.

III. Konvexné množiny a funkcie

Pri skúmaní ekonomických javov matematickými metódami sa taká vlastnosť mnohých množín a funkcií ako konvexnosť ukazuje ako veľmi významná. Povaha správania mnohých ekonomických objektov súvisí so skutočnosťou. že určité závislosti popisujúce tieto objekty sú konvexné. Existencia alebo jedinečnosť riešenia ekonomických problémov je často spojená s konvexnosťou funkcií a množín: na tejto vlastnosti sú založené mnohé výpočtové algoritmy.

Platnosť mnohých tvrdení týkajúcich sa konvexných množín a funkcií je celkom jasná, sú takmer zrejmé. Ich dokazovanie je zároveň často veľmi náročné. Preto tu budú uvedené niektoré základné fakty súvisiace s konvexnosťou bez dôkazov, počítajúc s ich intuitívnou presvedčivosťou.

1. Konvexné množiny v rovine

Akýkoľvek geometrický útvar v rovine možno považovať za množinu bodov patriacich k tomuto obrázku. Niektoré množiny (napríklad kruh, obdĺžnik, pásik medzi rovnobežnými čiarami) obsahujú vnútorné aj hraničné body; iné (napríklad úsečka, kruh) pozostávajú len z hraničných bodov.

Množina bodov v rovine sa nazýva konvexná, ak má nasledujúcu vlastnosť: úsečka spájajúca ľubovoľné dva body tejto množiny je celá obsiahnutá v tejto množine (obr. 1).

Príklady konvexných množín sú: trojuholník, úsečka, polrovina (časť roviny ležiaca na jednej strane priamky), celá rovina. Ďalšie príklady konvexných množín sú znázornené na obr. 2a. Na obr. 2b ukazuje príklady nekonvexných množín.

Množina pozostávajúca z jedného bodu a prázdna množina bez bodov sa podľa konvencie tiež považuje za konvexnú. V každom prípade v týchto množinách nie je možné nakresliť úsečku, ktorá spája niektoré body týchto množín a nepatrí úplne do týchto množín, - v nich

570 Matematická aplikácia

Ryža. 1. Úsečka spájajúca dva ľubovoľné body konvexného útvaru je obsiahnutá celá v ňom.

Ryža. 2. Konvexné (a) a nekonvexné (b) sady v rovine.

nie je možné vybrať dva body vôbec. Preto ich zaradenie medzi konvexné množiny nepovedie k rozporu s definíciou a to na matematické uvažovanie stačí.

Priesečník, t. j. spoločná časť dvoch konvexných množín, je vždy konvexný: ak vezmeme ľubovoľné dva priesečníky (a tie sú spoločné, t. j. patria do každej z pretínajúcich sa množín) a spojíme ich úsečkou, ľahko vidíme že všetky body úsečky i sú spoločné pre obe množiny, keďže každý z nich je konvexný. Vy - priesečník ľubovoľného počtu konvexných množín bude tiež konvexný.

Dôležitou vlastnosťou konvexných množín je ich oddeliteľnosť: ak dve konvexné množiny nemajú spoločné vnútorné body, potom je možné rovinu rezať pozdĺž priamky tak, že jedna z množín bude celá ležať v jednej polrovine a iné v druhej (na línii rezu).body oboch množín možno lokalizovať). Čiara oddeľujúca ich x sa v niektorých prípadoch ukazuje ako jediná možná, v iných nie (obr. 3).

Samotný hraničný bod akejkoľvek konvexnej množiny možno považovať za konvexnú množinu, ktorá nemá s pôvodnou množinou

Ryža. 3. Oddeľovacie čiary. Ryža. 4. Referenčné čiary.

III. Konvexné množiny a funkcie 571

spoločnými vnútornými bodmi, preto ho možno od neho oddeliť nejakou priamkou. Čiara oddeľujúca jej hraničný bod od konvexnej množiny sa nazýva nosná línia tejto množiny v danom bode. Referenčné čiary v niektorých bodoch vrstevnice môžu byť jediné, v iných nie jediné (obr. 4).

Zaveďme sústavu kartézskych súradníc x, y v rovine. Teraz máme možnosť považovať rôzne obrazce za množiny takých bodov, ktorých súradnice spĺňajú určité rovnice alebo nerovnice (ak súradnice bodu spĺňajú nejakú podmienku, pre stručnosť povieme, že túto podmienku spĺňa aj samotný bod).

Cvičenie 1

Uvažujme útvary, ktorých body spĺňajú nerovnice: a) y ³ x2 ; b)xy31; c)xy31, x > 0; d) |x| + |ó|£ 2;

e) (õ+1)2 + (ó – 2)2 £ 9. Ktoré z nich sú konvexné?

Lineárna rovnica ax + by = c je splnená bodmi priamky. Inými slovami, priamka je riešením tejto rovnice. Riešenie lineárnej nerovnosti

Riešením každej z nerovností je polrovina. Riešenie sústavy je množina bodov, z ktorých každý spĺňa všetky nerovnosti sústavy, t.j. riešenie sústavy nerovníc je priesečníkom všetkých riešení jednotlivých nerovností, ktoré sústavu tvoria. Polrovina je konvexná množina a priesečník konvexných množín je vždy konvexný. Riešením sústavy (2) je teda konvexná množina. Na obr. 5 je znázornené riešenie sústavy nerovníc

ïî - 2x - y ³ -7.

Ryža. 5. Riešenie sústavy troch lineárnych nerovníc.

572 Matematická aplikácia

Všimnite si, že nerovnosť ax + by £ c môže byť nahradená ekvivalentnou nerovnosťou –àõ – by³ –ñ v tvare (1). Okrem toho rovnica ax + by = c je ekvivalentná nasledujúcemu páru nerovností:

( ax + o ³ c; ax + o £ c.

Riešením sústavy lineárnych rovníc a nerovníc je teda vždy konvexná množina.

Cvičenie 2

Bude riešenie systému

ai x + bi y > ci, i = l, 2, ..., N

konvexná sada? Ako sa líši od riešenia sústavy s (2)?

Cvičenie 3

Vymyslite sústavy nerovníc, ktorých riešenia budú: a) rovnobežník; b) vnútro rohu; c) pásik medzi dvoma rovnobežnými priamkami; d) jeden bod; e) prázdna množina.

2. Konvexné funkcie jednej premennej

Najjednoduchší spôsob, ako definovať konvexnú funkciu, je geometricky. Na tento účel je užitočné zaviesť pojem epigraf funkcie. Epigraf funkcie je množina bodov umiestnených nad grafom funkcie a na samotnom grafe. Presnejšie povedané, epigraf funkcie f(x) je množina takých bodov, ktorých x-ová súradnica leží v obore funkcie a ktorých y-ová súradnica spĺňa nerovnosť y ³ f(x).

Funkcia sa nazýva klesajúca konvexná, ak jej epigraf je konvexná množina. Ryža. 6 ilustruje túto definíciu.

Ryža. 6. Epigraf konvexnej funkcie.

Ryža. 7. Tetivový bod nemôže byť pod grafom.

III. Konvexné množiny a funkcie 573

Vyššie uvedená definícia je dosť prísna a možno ju jednoznačne preložiť do analytického jazyka.

Po prvé, funkcia f(x) musí mať konvexnú definičnú oblasť - úsečku, lúč alebo celú čiaru.

V opačnom prípade by sa epigraf rozpadol na niekoľko samostatných oblastí a segment spájajúci body z rôznych oblastí by prešiel cez „zakázanú zónu“.

Aby sme zistili, akú podmienku musia spĺňať hodnoty zostupnej konvexnej funkcie f(x), „vyberieme na jej grafe dva ľubovoľné body M1 a M2 a nakreslíme tetivu M1 M2 (obr. 7). Musí ležať úplne v epigrafe, t. j. každý bod M akordu musí patriť do epigrafu.

Uvažujme číslo l, ktoré ukazuje pomer, v ktorom bod M rozdeľuje tetivu:

l = M2M.

M2 M1

Táto hodnota leží v rozmedzí 0 £ l £ 1. Je zrejmé, že v rovnakom pomere úsečka a os y bodu M rozdeľujú segmenty è [ó1 , ó2 ]:

õ2 – õ3 =l (õ2 – x1 ); y2 – y3 =l (y2 – y1);

õ3 =l x1 + (1 –l )õ2; y3 = l y1 + (1 –l )y2.

Podmienka, aby bod patril k nerovnosti y3 ³ f(õ3 ). A tak môže byť nerovnosť reprezentovaná v

M overgraph - takto y 1 \u003d f (x 1), y 2 \u003d f (õ 2) - toto

Ak je nerovnosť (3) splnená pre akékoľvek hodnoty x1 è õ2 , potom akýkoľvek akord leží v epigrafe a ešte viac každý segment spájajúci body umiestnené vyššie leží v epigrafe.

Funkcia f(x) definovaná na konvexnej množine je teda smerom dole konvexná, ak má nasledujúcu vlastnosť: pre ľubovoľné dve čísla x1 × õ2 z definičného oboru funkcie a ľubovoľné číslo l z intervalu platí nerovnosť (3).

Nerovnosť (3) sa často píše v „symetrickej“ forme

574 Matematická aplikácia

Ryža. 8. Funkcie: konvexné dole (a), konvexné hore (b), nemajúce trvalé označenie vydutia (c).

Funkcie, ktoré sú konvexné smerom nahor, možno definovať podobne: na tento účel musia byť znamienka nerovnosti (3) a (4) nahradené opačnými.

Funkcie, ktoré sú konvexné smerom nadol, sa často označujú jednoducho ako „konvexné“. Konvexné funkcie majú všeobecnejšiu vlastnosť ako nerovnosť (4). Ak x1 , õ2 ,..., xN sú ľubovoľné hodnoty argumentu l 1 ,l 2 ,...,

lN - nezáporné čísla, ktorých súčet sa teda rovná jednej

Vyberieme štyri hodnoty argumentu x1< õ2 < õ3 < õ4 è ïðî-

nakreslite tetivu M1 M4 (obr. 9).

Medziľahlé body M2 a Ì3

ležať v epigrafe, takže uhol

sklon tetivy M M * už nie,

a akordy M * M

Nie menej ako

M M *

uhol tetivy

abscisa (uhly sklonu - berúc do úvahy

znamenia!). teda

rýchlosť

zvýšenie konvexnej funkcie v

oblasti "veľkých" hodnôt ar-

gumenta (v oblasti [х3, ​​​​х4]) nie

menej ako v oblasti „malých“

hodnoty (). Obracia na

v rámci

x 2® x 1è

® x 3,

f¢ (x3)

³f¢(x1) ,

Ryža. 9. Akord nakreslený v ploche

derivát

¢(x) diferencovať

konvexná funkcia f (x) - nie -

veľké hodnoty argument, má

III. Konvexné sady a funkcie 575

Ak je derivácia f¢(x) diferencovateľná (to znamená, že konvexná funkcia f(x) je dvakrát diferencovateľná), potom f¢¢(x) ³ 0. Pre dvakrát diferencovateľné funkcie sa táto nerovnosť ukáže ako ekvivalentná vyššie uvedená definícia konvexnej funkcie; v kurzoch matematická analýza konvexnosť je zvyčajne určená znamienkom druhej derivácie. Ale v ekonomických aplikáciách, kde sa človek často musí zaoberať funkciami, ktorých grafy majú zlomy, je takáto definícia málo užitočná.

Ak f(x) a g(x) sú konvexné funkcie a a ³ 0, potom funkcie

a) f(x) + g(x);

c) max(f(x), g(x)).

Konvexnosť funkcií v a) ab) sa overuje priamo pomocou nerovnosti (3) alebo (4). Funkcia c) pre každé x nadobúda hodnotu rovnajúcu sa väčšej z hodnôt f(x) a g(x) (a jednej z nich, ak sú rovnaké). Epigraf funkcie max(f(x), g(x)) je priesečníkom epigrafov funkcií f(x) a g(x) (preverte si to!) – preto konvexnosť funkcie c).

Cvičenie 4

Existujú funkcie konvexné smerom nadol a konvexné nahor súčasne?

Cvičenie 5

Ako vyzerá graf funkcie f(x) = max (0, a + bx) pre rôzne hodnoty parametrov a a b? Sú tieto funkcie konvexné?

Cvičenie 6

Je funkcia konvexná

Ryža. 10. Grafy funkcií f(x) (1), g(x)

N (2) a max(f(x), g(x)) (3). f(x) = å fi (x) ,

fi(x) = max(0, ai + bi x)?

Ako vyzerá jej rozvrh?

576 Matematická aplikácia

Cvičenie

Zvážte

ìax,

f(x) = i

ïï

B × (x - 1), x ³ 1.

Pre aké hodnoty a a b táto funkcia

Zakrivený nadol?

Zakrivené?

- nemá trvalé konvexné znamienko?

IV. Priestor požehnania

Základné pojmy

veľa teoretické otázky sú rozoberané v našej učebnici pre prípad dvoch produktov. Ako pohodlný nástroj, ktorý výrazne zjednodušuje ich analýzu, sme použili grafické konštrukcie, v ktorých množinu obsahujúcu dva produkty v množstvách x1, и x2 predstavoval bod na rovine s Kartézske súradnice(x1,x2). Preklad teoretické koncepty do geometrického jazyka veľmi objasnil vlastnosti diskutovaných javov a zároveň neviedol k strate prísnosti: všetky geometrické pojmy (priame čiary, krivky, uhly sklonu atď.) mali presne definované analytické ekvivalenty - rovnice , deriváty, vzťahy medzi parametrami atď. Preto sú takéto konštrukcie široko používané tak v učebniciach ekonómie, ako aj vo vedeckých publikáciách.

Tieto geometrické úvahy však boli rigorózne a presné len v prípadoch, keď zoznam spotrebovaného tovaru obsahoval iba dve položky. V skutočnosti je počet výhod, ktoré ľudia využívajú, oveľa väčší. Závery, ku ktorým sa dospelo geometricky, možno považovať za dostatočne všeobecné, ak ich možno rozšíriť na prípady ľubovoľného počtu tovarov.