![]() |
|
|
Реферат: Экстремумы функцийa11>0, a21 a22 a21 a22 a23 >0 a31 a32 a33
Следовательно, чтобы исследовать точку М(x0,y0,z0) на экстремум , надо исследовать квадратичную форму ( 4.5). Сформулируем полученный результат в виде теоремы. Теорема : Пусть в некоторой области, содержащей точку М(x0,y0,z0), функция f(x,y,z) имеет непрерывные частные производные до второго порядка включительно; пусть кроме того, точка М(x0,y0,z0) является критической точкой функции f(x,y,z), т.е. f(x0,y0,z0) f(x0,y0,z0) f(x0,y0,z0) --------------- =0, ---------------=0, ---------------=0 x y z Тогда при x=x0,y=y0,z=z0 : 1) f(x,y,z) имеет максимум , если 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 ---------------<0 , -------------------------------- - --------------- >0 x2 x2 y2 x y 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 --------------- -------------------------------- - --------------- -- x2 x2 z2 y z
2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) -- --------------- -------------------------------- -- x y x y z2 2 f(x0,y0,z0) 2 f(x0,y0,z0) -- --------------------------------- + x z y z 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) + --------------- -------------------------------- -- x z x y y z 2 f(x0,y0,z0) 2 f(x0,y0,z0) -- ------------------------------- >0 x z y2
2) f(x,y,z) имеет минимум, если 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 --------------->0 , -------------------------------- - --------------- >0 x2 x2 y2 x y 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 --------------- -------------------------------- - --------------- -- x2 x2 z2 y z
2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) -- --------------- -------------------------------- -- x y x y z2 2 f(x0,y0,z0) 2 f(x0,y0,z0) -- --------------------------------- + x z y z 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) + --------------- -------------------------------- -- x z x y y z 2 f(x0,y0,z0) 2 f(x0,y0,z0) -- ------------------------------- >0 x z y2
3)если 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 --------------- -------------------------------- - --------------- -- x2 x2 z2 y z
2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) -- --------------- -------------------------------- -- x y x y z2 2 f(x0,y0,z0) 2 f(x0,y0,z0) -- --------------------------------- + x z y z 2 f(x0,y0,z0) 2 f(x0,y0,z0) 2 f(x0,y0,z0) + --------------- -------------------------------- -- x z x y y z 2 f(x0,y0,z0) 2 f(x0,y0,z0) -- ------------------------------- =0 x z y2 то экстремум может быть , а может и не быть (в этом случае требуется дальнейшее исследование ) 4) во всех остальных случаях f(x,y,z) не имеет ни максимума , ни минимума. 5.Экстремумы функций многих переменных. 5.1.Необходимые условия экстремума. Пусть функция u=f(x1,x2,…,xn) определена в области D и (x10,x20,…,xn0) будет внутренней точкой этой области. Говорят, что функция u=f(x1,x2,…,xn) в точке (x10,x20,…,xn0) имеет максимум (минимум), если её можно окружить такой окрестностью (x10 x10 x20 x20 xn0 xn0 ) что бы для всех точек этой окрестности выполнялось неравенство f(x1,x2,…,xn)<f(x10,x20,…,xn0) (>) Если эту окрестность взять настлько малой, что бы знак равенства был исключён, т. е. чтобы в каждой её точке, кроме самой точки (x10,x20,…,xn0) выполнялось строгое неравенство f(x1,x2,…,xn)<f(x10,x20,…,xn0) (>) то говорят, что в точке (x10,x20,…,xn0) имеет место собственный максимум (минимум), в противном случае максимум (минимум) называют несобственным. Для обозначения максимума и минимума (как и в случае одной переменной) употребляется общий термин – экстремум. Предположим, что наша функция в некоторой точке (x10,x20,…,xn0) имеет экстремум, Покажем, что если в этой точке существуют (конечные) частные производные fx1’(x10,x20,…,xn0) ,…, f ’xn(x10,x20,…,xn0) то все эти частные производные равны нулю, так что обращение в нуль частных производныхпервого порядка является необходимым условием существования экстремума. С этой целью положим x2=x20,…,xn= xn0 сохраняя x1 переменным ; тогда у нас получится функция от одной переменной x1 : u=f(x1, x20,…,xn0) Так как мы предположили, что в точке (x10,x20,…,xn0) существует экстремум (для определенности - пуcть это будет максимум), то, в частности, отсюда следует, что в некоторой окрестности(x10- , x10+ ) точки x1= x10, необходимо должно выполняться неравенство f(x1, x20,…,xn0)< f(x10,x20,…,xn0) так что упомянутая выше функция одной переменной в точке x1= =x10 будет иметь максимум, а отсюда по теореме Ферма следует, что fx1’(x10,x20,…,xn0)=0 Таким образом можно показать, что в точке (x10,x20,…,xn0) и остальные частные производные равны нулю. Итак, «подозрительными» на экстремум являются те точки, в которых частные производные первого порядка все обращаются в нуль: их координаты можно найти, решив систему уравнений fx1’(x10,x20,…,xn0)=0 ……………………. (5.1) f ’xn(x10,x20,…,xn0)=0 Как и в случае функции одной переменной, подобные точки называются стационарными. Замечения :Необходимое условие существования экстремума в случае дифференцируемой функции кратко можно записать так : d f(x1,x2,…,xn)=0 так как, если fx1’= fx2’=…= f ’xn , то каковы бы ни были dx1,dx2,…,dxn всегда f(x1,x2 d,…,xn)= fx1’ dx1+ fx2’ dx2+…+ f ’xn dxn=0 И обратно : если в данной точке тождественно выполняется это условие, то ввиду произвольности dx1,dx2,…,dxn производные fx1’, fx2’,…, f ’xn порознь равны нулю. Обычно, рассматриваемая функция f(x1,x2,…,xn) имеет (конечные) частные производные во всей области, и тогда точки, доставляющие функции экстреммы, следует искать лишь среди стационарных точек. Однако встречаются случаи, когда в отдельных точках некоторые частные производные имеют бесконечные значения или вовсе не существуют (в то время как остальные равны нулю). Подобные точки, собственно, тоже следует причислить к «подозрительным» по экстремуму, наряду со стационарными. Иногда дается и не прибегая к достаточным условиям выяснить характер стационарной точки функции. Так, если из условия задачи непременно следует, что рассматриваемая функция имеет где-то максимум или минимум и при этом системе уравнений (5.1) удовлетворяет только одна точка, то ясно, что эта точка и будет искомой точкой экстремума функции. Заметим, наконец, что точками экстремума непрерывной функции могут быть точки, в которых функция недифференцируема (им соответствуюя, например, острия поверхности – графика функции). 5.2.Достаточные условия экстремума. Так же как и для функции одной переменной, необходимый признак экстремума в случае многих переменных не является достаточным. Это значит, что из равенства нулю частных производных в данной точке вовсе не следует, что этаточка обязательно является точкой эксремума. Достаточные условия экстремума для функций нескольких переменных носит значительно более сложный характер, чем для функции одной переменной. Пусть функция f(x1,x2,…,xn) определена, непрерывна и имеет непрерывные производные первого и второго порядковокрестности некоторой стационарной точки (x10,x20,…,xn0).Разлагая разность = f(x1,x2,…,xn)-f(x10,x20,…,xn0) по формyле Тейлора, получим = { fx ’’ x12+fx ’’ x22+…+fx ’’ xn2+2fx1x2 ’’ x1 x2+ +2fx1x3 ’’ x1 x3+…+2fxn-1xn ’’ xn-1 xn}= fxixj ’’ xi xj где x= xi-xi0 ; производные все вычеслены в некоторой точке (x10+0 x1, x20+0 x2,…, xn0+0 xn) (0<0<1) Введём и здесь значения fxixj ’’ (x10,x20,…,xn0)=aik (i,k=1,2,…,n) (5.2) так что fxixj ’’ (x10+0 x1, x20+0 x2,…, xn0+0 xn)= aik+ ik и ik 0 при x1 0,…, xn 0 (5.3) Теперь интеесующее нас выражение можно написать в виде: = { aik xi xk+ ik xi xk} (5.4) На первом месте в скобках здесь стоит второй дифференциал функции f в рассматриваемой точке : он представляет собой однородный одночлен второй степени или, как говорят, квадратичную форму от переменных x1,…, xn. От свойств этой квадратичной формы, как мы увидим, и зависит решение интересующего нас вопроса. В высшей алгебре квадратичную форму aik yi yk (aik = aki) (5.5) от переменных y1,…,yn называют определенной положительно (отрицательно), если она имеет положительные (отрицательные) значения при всех значениях аргументов, не равных одновременно нулю. Необходимое и достаточное условие для того, чтобы форма (5.5) была определенной и положительной принадлежит ,как было уже сказано выше , Сильвестеру (J.J.Sylvester). Оно выражается цепью неравенств: a11 a12 a11 a12 a13 a11 a12… a1n a11>0, a21 a22 , a21 a22 a23 >0,…, a21 a22… a2n a31 a32 a33 ………………… an1 an2… ann Так как определенная отрицательная форма с изменением знака всех её членов переходит в определенню положительную, и обратно, то отсюда легко найти и характеристику отицательной формы : она дается цепью неравенств, которая получается из написанной выше изменением смысла неравенств через одно (начиная с первого). Пользуясь этими понятиями. Сформулируем достаточные для существования экстремума условия : Если второй дифференциал,т. е. квадратичная форма aik xi xk (5.6) со значениями (5.2) коэффициентов – оказывается определенной положительной (отрицательной) формой, то в используемой точке (x10,x20,…, xn0) будет собственный минимум (максимум). Для доказательства введем расстояние = x12+…+ xn2 между точками (x10,x20,…,xn0) и (x1,x2,…,xn). Вынося в (5.5) за скобку и полагая xi (i=1,2,…,n) перепишем выражение для в виде = { aik Ei Ek+ ik Ei Ek} (5.7) Числа Ei зараз не обращаются в нуль, поэтому, если форма (5.7) – положительная, первая сумма в скобках в формуле (5.7) иммет всегда положительный знак. Больше того, так как Ei=1 (5.8) то найдется такое постоянное положительное число m, что при всех возможных значениях Ei будет aik Ei Ek>m Действительно, эта сумма представляет собой непрерывную функцию от аргументов Ei во всем пространстве,в частности же и в множестве М тех точек(E1,…, En), которые удовлетворяют соотношению (5.8) («сферическая поверхность»). Но множество это, как нетрудно видеть, замкнуто, т. е. содержит все свои точки сгущения ; а тогда, по теореме Вейерштрасса, названная сумма будет иметь в М наименьшее значение , необходимо положительное (как и все ее значения в М). С другой стороны, ввиду (5.3) вторая сумма в (5.7) для достаточно малых ,очевидно, будет по абсолютной величине уже меньше m, так что вся скобка окажется положительной. Итак, в достаточно малой сфере, с центром в точке (x10,x20,…,xn0) разность будет положительна, откуда и явствует, что в названной точке функция f(x1,x2,…,xn) имеет собственный минимум. Аналогично исчерпывается и случай, когда форма (5.6) будет определенной, но отрицательной. Для того, чтобы квадратичная форма (5.6) была отрицательно определенной, необходимо и достаточно, чтобы a11 a12 a11 a12 a13 a11 a12… a1n a11<0, a21 a22 , a21 a22 a23 <0,…,(-1)n a21 a22… a2n a31 a32 a33 ………………… an1 an2… ann 5.3.Метод вычисления критериев Сильвестера. Применение критерия Сильвестера для определения экстремума функции многих переменных требует вычисления определителей порядка. Рассмотрим один из возможных методов диагонализации матриц и соответственно получения треугольных определителей.Метод основан на последовательном понижении порядка определителя. При этом : 1.На каждом этапе понижения порядка определителя, удобная для применения вычислительной техники. 2.Получаемые в результате диагональные элементыопределителей являются элементами критерия Сильвестера и позволяют, так сказать, в «ходе вычисления» вести контроль знакоопределенности квадратичной формы. В основу алгоритма вычислений положины два свойства определителей. 1.Известно, что a11 a12 a21 a22 Впредь замена любого определителя второго порядка элементом a11 назовем «сверткой» определителя. 2.Определитель порядка не изменится, если элементы какой-либо строки умножить (разделить) на какое-либо число, не равное нулю, и сложить (вычесть) с элементами другой строки. Итак, рассмотрим определитель n-го порядка, составленный из вторых частных производных некоторой функции n– переменных f(x1,x2,…,xn). Положим aik= fxixk ’’ .Имеем a11 a12… a1n ………………… (5.9) an1 an2… ann Умножим в (5.9) элементы первой строки на a21/ a11 и вычтем их из элементов второй строки. Умножим в (5.9) элементы первой строки на a31/ a11и вычтем их из элементов третьей строки. … Умножим в (5.9) элементы первой строки на an1/ a11 и вычтем их из элементов последней строки. Выполнив последовательно эти операции, получим a11 a12 … a1n 0 a22- a12 a21/ a11… a2n -a1n an1/ a11 ……………………………………………………… (5.10) 0 an2- a12 an1/ a11… ann- a1n an1/ a11 Умножим каждую строку в (5.10), начиная со второй на a11,при этом определитель (5.10) умножится на a11n-2 1 ----------- (5.11) a11n-2 где a11 a22- a12 a21 a11 a23- a13 a21 … a11 a2n- a1n a21 a11 a32- a12 a31 a11 a33- a13 a31 … a11 a13n- a1n a31 ………………………………………………… (5.12) a11 an2- a12 an1 a11 an3- a13 an1 … a11 ann- a1n an1 Рассмотрим более внимательно элементы (5.12). Перепишем (5.12) в виде a11 a12 … a1n-1 a21 a22 … a2n-1 ………………… (5.13) an-11 an-12… an-1n-1 Из сравнения (5.12) и(5.13) видно, что a11 – есть свертка определителя a11 a12 a21 a22
a12 – есть свертка определителя a11 a13 a21 a23 ………………………………………………………….. a1n-1 – есть свертка определителя a11 a1n a21 a2n . Таким образом, первая строка 1n-1 является сверткой элементов первых двух строк определителя n. Более наглядно это можно сфрмклировать так : последовательно каждый «прямоугольник» элементов первой и второй строк заменяется его сверткой ; причем первые элементы двух строк «участвуют» во всех прямоугольниках этих строк. a11 a12 a13… a1n a11 a12 a1n-1 a21 a22 a23… a2n Аналогично вторая строка определителя n-1 является сверткой элементов первой и третьей строк исходного определителя. a11 a12 a13… a1n a21 a22 a2n-1 a31 a32 a33… a3n Наконец для последней строки n-1 имеем a11 a12 a13… a1n an-1 1 an-1 2 an-1n-1 an1 an2 an3… ann Если теперь применить те же опервции к определителю n-1, т. е. к (5.13), получим 1 a11n-3 (5.14) где a11 a12 … a1 n-2 a21 a22 … a2 n-2 …………………………….. an-2 1 an-2 2… an-2 n-2 а элементы aik являются сверткой соответствующих определителей – прямоугольников. Очевидно, повторяя эту операцию n–1 раз, получим следующую формулу, предварительно введя более простые обозначения : a11 = a1– левый угловой верхний элемент a11 = a2 – левый угловой верхний элемент a11 = a3 – левый угловой верхний элемент ………………………………………… a11 = an – левый угловой верхний элемент. С учетом этого an a1n-2 a2n-3… an-1 (5.15) n>2 Пример №1. 2 1 5 3 0 4 7 2 1 2*4-1*0 2*7-5*0 2*2-3*0 1 8 14 4 5 6 3 1 22 2*6-5*1 2*3-5*5 2*1-5*3 22 7 –19 -13 0 2 1 3 2*2-0*1 2*1-5*0 2*3-3*0 4 2 6 4 7 2 7 –19 –13 1 4*(-19)-7*7 4*(-13)-2*7 1 -72-49 -52-14 2 3 1 4 4*1-2*7 4*3-2*2 4 -10 8 1 -121 -66 1 -121 -66 1 4 -10 8 2 -5 4 2 (-121*4-66*5)= -121*2-33*5= = -242 –165= -407 Пример №2. 3 0 2 1 5 0 4 1 3 6 1 3*4-0*0 3*1-2*0 3*3-0*1 3*6-5*0 1 2 3 5 1 33 3*2-5*0 3*3-5*2 3*5-5*1 3*1-5*5 0 3 4 0 6 3*3-2*0 3*4-2*2 3*0-2*1 3*6-2*5 1 2 3 4 5 3*2-1*0 3*3-1*2 3*4-1*1 3*5-1*5 12 3 9 18 -30 66 -264-108 1 6 –1 10 -22 1 69 -105 96-162 33 9 8 -2 8 33*122 66 78 120-108 6 7 11 10
-30 66 -372 30*105-66*69 30*66+69*372 1 69 -105 -66 1 -30*78-66*66 -30*12+66*372 33*122 66 78 12 33*122*(-30) 1 3150-4554 1980+25668 1 -1404 27648 33*122*(-30) -2340-4356 -360+24552 33*122*(-30) –6696 24192 -1404*24192+6696*27648 33965568-182476800-2654208 33*122*(-30) 33*122*30 31311360-182476800 15116544 15116544 33*122*30 33*122 3888 =3888 Вычесленные в порядке получения определителий n, n-1, …, 2 их верхние левые угловые элементы a1,a2,…,an являются критерием Сильвестера в части знаков, т.е. sign a11=sign a1 sign a11=sign a2=sign a11 a12 a21 a22 ……………………………. a11… a1n sign a11=sign an=sign ……….. an1… ann По сути метод дает возможность вычисления определителей . Однако нас интересуют лишь знаки определителей.Это существенно упрощает задачу. Рассмотрим функцию f(x1,x2,…,xn). имеющую экстремум,а именно максимум в точке М0(x10,x20,…,xn0).Это значит,что все коэффициенты a1, a2,…, an должны быть положительными. Поэтому процесс определения максимума функции в точке М0 заканчивается на любом этапе понижения определителя ,если после положительных a1, a2,…, ak коэффициент аk+1 стал отрицательным или нулевым. Если же в точке М0 – минимум, то коффициенты a1, a2,…, an образуют знакочередующуюся последоватнльность, а именно a1<0, a2>0, a3<0,… Аналогично процесс прекращается, если нарушается эта знакопеременность. Итак, общая схема выглядит следующим образом : 1.Определяются стационарные точки функции, в которых f xi i=1,2,3,….,n 2.Определяются коэффициенты аik в этих точках 2f xi xr 3.Выясняем знак первого диагонального элемента а11=а1 а) если а11>0, то все последующие элементы а2,а3,…,аn должны быть положительными,если в точке М0 действительно максимум б)если а11<0, то знаки последующих элементов а2,а3,…,аn должны чередоваться, если в точке М0 действительно минимум. 4.При нарушении какой-либо из закономерностей в п.3 процесс прекращается и формулируется вывод о том,что в точке М0 экстремума нет. Наконец отметим следующее важное обстоятельство. Так как коэффициенты аik являются частными производными второго порядка и для дифференцируемой функции с непрерывными 2f/ xi xr в соответствии с теоремой Шварца эти частные производные не зависят от порядка дифференцирования, то аik= аki. Это важное свойство приводит к тому, что матрица (аik) является симметрической вместе со своим определителем аik Покажем, что учет этого факта сокращант объем вычислений по крайней мере вдвое . |
|
|||||||||||||||||||||||||||||
![]() |
|
Рефераты бесплатно, реферат бесплатно, курсовые работы, реферат, доклады, рефераты, рефераты скачать, рефераты на тему, сочинения, курсовые, дипломы, научные работы и многое другое. |
||
При использовании материалов - ссылка на сайт обязательна. |