Lineární nezávislost

Ústředním konceptem lineární algebry je pojem lineární nezávislosti potažmo lineární závislosti vektorů z daného vektorového prostoru. Pomocí tohoto pojmu se definují další velmi důležité objekty lineární algebry, jako je například báze vektorového prostoru. Máme-li soubor několika vektorů, pak lineární závislost je matematicky zachycená intuitivní představa o tom, že lze jeden vektor vyjádřit pomocí ostatních, pokud jsou si tyto vektory dostatečně podobné. Pokud jsou tyto vektory příliš rozdílné, pak nedokážeme sčítáním či prodlužováním vyjádřit jeden vektor pomocí zbylých. Takové vektory jsou lineárně nezávislé.


Motivace

editovat
 
Obr. 1: Příklad dvou vektorů v rovině, kdy je druhý vektor násobkem vektoru prvního. Jde tedy o lineárně závislé vektory.
 
Obr. 2: Příklad dvou vektorů v rovině, kdy došlo vůči prvnímu obrázku k jisté změně prvního vektoru. Žádný z těchto dvou vektorů již nelze vyjádřit jako násobek toho druhého. Jedná se tedy o lineárně nezávislé vektory.

Uvažujme rovinu a v ní mějme šipky ve významu vektorů. Matematicky daná situace odpovídá reálnému vektorovému prostoru  , pro vztah tohoto vektorového prostoru a prostoru šipek v rovině viz oddíl Geometrická interpretace v článku lineární kombinace. Vezměme si konkrétní příklad se šipkami   vyznačenými na prvním obrázku. Jejich vektorový zápis je

 

Vidíme, že obě šipky leží na jedné přímce. Navíc vidíme, a je to vidět i z číselného zápisu vektorů výše, že když vektor   obrátíme, bude směřovat stejným směrem jako vektor  , a když ho ještě prodloužíme na dvojnásobnou délku, tak se bude přesně rovnat tomuto druhému vektoru. Neboli platí

 

Pokud si v rovnosti výše převedeme oba vektory na jednu stranu, dostáváme výraz

 

který je speciálním případem tzv. lineární kombinace vektorů. Obecně lze lineární kombinaci dvou vektorů vyjádřit ve tvaru  . V našem případě lze tedy výše uvedenou rovnost přepsat jako

 

Koukněme se nyní na druhý obrázek, kde jsme první vektor pozměnili tak, že jsme mu přepsali jeho druhou složku, máme nyní tedy

 

Z obrázku teď ale vidíme, že již nelze vektor   vyjádřit jako násobek vektoru  . Ať tedy vezmeme jakékoli reálné číslo  , tak se nám nepodaří splnit rovnost  . Zkusme nyní prodlužovat či zkracovat, tj. škálovat, oba vektory, ne jen vektor  , a ptejme se, zda by se tyto přeškálované vektory mohly rovnat. Uvažujme tedy výraz

 

kde   jsou čísla, která bychom chtěli najít, aby platila rovnost. Když by bylo číslo   nenulové, mohli bychom jím vydělit tuto rovnost a dostat výraz  , kde  . O tomto výrazu jsme ale už viděli, že nemůže nastat. Vyjadřoval by totiž, že vektor   je násobkem vektoru  . Co ale, když je číslo   rovno nule? V takovém případě obdržíme rovnost  , kterou ale můžeme vždy splnit tak, že položíme  . Pro nenulový vektor   je to navíc jediná volba, jak danou rovnost splnit. Když si nyní přeznačíme naše koeficienty jako   a  , tak můžeme podobně jako pro první obrázek psát

 

Vidíme tedy, že když máme dva nenulové vektory mířící různým směrem, tak jejich lineární kombinace, která má být rovná nulovému vektoru, už musí mít nutně oba koeficienty nulové. Lineární kombinaci, která má všechny koeficienty nulové, se říká triviální lineární kombinace. V opačném případě se lineární kombinace nazývá netriviální.

Shrňme si naše dosavadní sledování. Když byl vektor   násobkem vektoru   (Obr. 1), tak lineární kombinace   měla nenulové koeficienty   a  . Když ale jeden vektor nešel vyjádřit jako násobek toho druhého (Obr. 2), tak jsme obdrželi lineární kombinaci, jejíž koeficienty byly nutně nulové.

První případ by šlo popsat tak, že oba vektory byly závislé v tom smyslu, že z jednoho jsme byli schopni vhodnou úpravou dostat vektor druhý. Ve druhém případě ale už takovou úpravu provést nešlo a vektory byly v tomto smyslu nezávislé. Tato úvaha nás vede na obecnou definici lineární nezávislosti potažmo závislosti, nyní již pro libovolný (nenulový konečný) počet vektorů obecných vektorových prostorů. Místo lineárních kombinací pouze dvou vektorů už tak musíme uvažovat lineární kombinace obecného tvaru

 

kde   jsou prvky tělesa, nad kterým je vektorový prostor definován.

Definice

editovat

Buď   vektorový prostor nad tělesem   a mějme dále soubor vektorů   pro jisté přirozené číslo  . Uvažujme pak všechny možné lineární kombinace tohoto souboru vektorů, které jsou rovny nulovému vektoru. Pak říkáme, že soubor   je lineárně nezávislý, právě když ze všech lineárních kombinací těchto vektorů je rovna nulovému vektoru jen triviální lineární kombinace. V opačném případě nazýváme soubor výše lineárně závislý. Pro lineární nezávislost se občas používá zkratka LN a pro lineární závislost zkratka LZ.[zdroj?]

Výše uvedenou definici lze přeformulovat i takto: Vektory   se nazývají lineárně závislé, pokud existuje netriviální lineární kombinace těchto vektorů, jejíž hodnota je nulový vektor. Lze tedy nalézt takové koeficienty   pro něž platí, že

   a alespoň jeden z koeficientů  .

Pokud taková netriviální lineární kombinace neexistuje, pak jsou vektory označovány jako lineárně nezávislé a jejich lineární kombinace je nulový vektor jedině v triviálním případě, kdy jsou všechna  .

Lineární (ne)závislost lze definovat pro libovolné podmnožiny vektorového prostoru, tedy i pro ty s nekonečným počtem prvků. Pak říkáme, že podmnožina vektorového prostoru je lineárně nezávislá množina, právě když každý konečný soubor vektorů z ní vybraný je lineárně nezávislý. Pokud existuje alespoň jeden konečný soubor vektorů, který je lineárně závislý, je daná množina lineárně závislá.

Abychom si ozřejmili výše podanou formální definici lineární nezávislosti souboru vektorů, mějme vektory   a uvažujme jejich lineární kombinaci

 

pro obecné koeficienty  ,  . Položme nyní tuto lineární kombinaci rovnou nulovému vektoru a ptejme se, jaké hodnoty musí mít koeficienty, aby skutečně platila rovnost. To jest

 

kde máme pevně určeny vektory   a hledáme k nim příslušné koeficienty  . Pokud po výpočtu výrazu na levé straně zjistíme, že jediné koeficienty, které danou rovnost splňují, musí být všechny rovny nule, tak říkáme, že dané vektory   jsou lineárně nezávislé. Pokud alespoň jeden koeficient je nenulový a rovnost výše je splněna, pak tyto vektory nazveme lineárně závislými.

Protože platí, že všechny koeficienty jsou nulové, právě když  , a alespoň jeden koeficient je nenulový, právě když  , můžeme definici lineární nezávislosti přeformulovat následovně:

Vektory   jsou lineárně nezávislé, právě když platí

 

Vektory   jsou lineárně závislé, právě když platí

 

Vlastnosti

editovat

V následujících tvrzeních vždy uvažujeme vektorový prostor   nad tělesem  .

Alternativní definice

editovat

Lineární (ne)závislost se definuje i tak, že soubor vektorů je lineárně závislý, právě když existuje v tomto souboru vektor, který lze vyjádřit jako lineární kombinaci vektorů zbylých. Jinak řečeno, soubor vektorů je lineárně závislý, právě když existuje vektor ležící v lineárním obalu vektorů zbylých. Protože jsme výše zvolili jinou definici, tak si toto tvrzení nyní dokážeme.

  • Buď   soubor n vektorů, kde  . Pak   je lineárně závislý, právě když existuje vektor   pro jisté   tak, že
 
kde   značí lineární obal.
Důkaz: Dokažme nejdříve implikaci zleva doprava, tj. mějme lineárně závislý soubor. Existuje tedy netriviální lineární kombinace tohoto souboru dávající nulový vektor, neboli   kde je alespoň jeden koeficient nenulový. Označme si ho  . Pak můžeme psát
 

Nyní můžeme sumu výše převést na druhou stranu rovnosti. Protože je   nenulový, můžeme jím dělit a dostáváme tak vyjádření pro vektor   pomocí zbylých vektorů

 

Pro důkaz opačné implikace předpokládejme, že lze jistý vektor   vyjádřit jako lineární kombinaci zbylých vektorů ve tvaru

 

Když si vektor   ale převedu na pravou stranu rovnosti, tak rázem dostávám netriviální lineární kombinaci původního souboru vektorů, která dává nulový vektor (konkrétně  ). Soubor je tak lineárně závislý.

Přímým důsledkem právě dokázané věty je následující tvrzení:

  • Buď   lineárně závislý soubor n vektorů, kde  . Pak existuje   tak, že
 
Důkaz: Zřejmý z předchozího tvrzení a druhého tvrzení v oddíle Ostatní vlastnosti v článku Lineární obal.

Ostatní

editovat
  • Množina obsahující jediný vektor je lineárně nezávislá, právě když je tento vektor nenulový, tj.
 
Důkaz: Obecná lineární kombinace jednoho vektoru má tvar   pro nějaké  . Dokažme nejprve sporem implikaci zleva doprava. Máme tedy lineárně nezávislou množinu obsahující jediný vektor a předpokládejme, že je tento vektor nulový. Pak je ale lineární kombinace   nulová pro libovolnou hodnotu koeficientu   a ne jen v triviálním případě, kdy  . Máme tak spor s definicí. Ukažme nyní implikaci zprava doleva. Když je vektor   nenulový, pak lineární kombinace   bude rovna nulovému vektoru jen pro  , což jsme měli dokázat.
  • Pokud je soubor vektorů   ( ) lineárně nezávislý, tak je lineárně nezávislá i každá jeho podmnožina. Neboli, mějme   soubor n vektorů, nechť   je nějaké číslo splňující   a nechť   je l-tice čísel taková, že  . Pak, jsou-li   lineárně nezávislé, jsou lineárně nezávislé i vektory  .
Důkaz: Je vhodnější dokazovat obměněnou implikaci původního tvrzení, tj. dokažme, že když je soubor   lineárně závislý, tak je lineárně závislý i soubor  . Předpokládejme, že je   lineárně závislý, tj. existuje l-tice koeficientů   tak, že
 

Potom ale dostáváme i netriviální lineární kombinaci původního souboru

 

když položíme   pro   a   jinak.

  • Nechť   je lineárně závislý soubor n vektorů. Pak buď  , nebo   a přitom existuje   takové, že
 
kde   značí lineární obal.
Důkaz: Z prvního tvrzení této sekce plyne, že pro   musí být již nutně  , jinak by byl soubor lineárně nezávislý. Máme teď tedy lineární kombinaci   s alespoň jedním koeficientem nenulovým. Abychom dokončili důkaz věty, tak musíme ukázat, že alespoň jeden nenulový je nějaký z koeficientů  . Pro spor předpokládejme, že  . Pak ale
 

Protože ale  , musí být  . Jenže to by znamenalo, že jsou úplně všechny koeficienty lineární kombinace nulové, což je spor s tím, že jsme původně volili netriviální lineární kombinaci. Máme tak dokázáno, že mezi koeficienty   je alespoň jeden nenulový. Vezměme tedy ten, který má ze všech koeficientů největší index. Označme si ho  . Postupem stejným jako v důkaze prvního tvrzení sekce Alternativní definice si vyjádříme vektor   pomocí vektorů ostatních. Ty mají všechny menší index než  . Dostáváme tak tvrzení věty.

Příklady

editovat

Příklad 1 — Aritmetické vektory

editovat

Nejčastějšími příklady vektorů jsou n-tice čísel, tzv. aritmetické vektory. Uvažujme pro konkrétnost prostor   s klasicky definovanými operacemi sčítání dvou vektorů a násobení vektoru číslem. V tomto prostoru mějme následující tři vektory

 

Zkoumejme, zda jsou tyto vektory lineárně nezávislé. Uvažujme tedy jejich lineární kombinaci dávající nulový vektor

 

Využijeme-li definice sčítání vektorů a jejich násobení číslem, tak nám výše uvedená rovnost přejde do tvaru

 

Třetí řádek rovnosti nám určuje  . Dosadíme-li tuto hodnotu to zbylých dvou řádků, zbude nám soustava dvou rovnic pro dvě neznámé

 

Ta je zjevně splněna jen pro   a  . Všechny tři koeficienty jsou tedy nulové a my jsme tím dokázali, že vektory   jsou lineárně nezávislé.

Příklad 2 — Polynomy

editovat

Vektorové prostory mohou být ale rozmanitější, než jen ty s n-ticemi čísel. Vektorovým prostorem je například i množina všech polynomů. Vezměme čtyři jednoduché polynomy a zkoumejme u nich lineární nezávislost:

 

Jako u aritmetických vektorů uvažujme tedy nejprve jejich obecnou lineární kombinaci, kterou položíme rovnou nulovému vektoru, což je v našem případě nulový polynom. To jest

 

Shlukneme-li si čísla k jednotlivým mocninám nezávisle proměnné, dostáváme

 

Máme nyní rovnost, kde na jedné straně vystupuje jistý polynom třetího stupně a na straně druhé je pak nulový polynom, nulová funkce. Tuto rovnost je třeba chápat tak, že musí být splněna pro všechny hodnoty, kterých může nezávisle proměnná nabývat, tj. pro všechna reálná  . Dosaďme pár konkrétních hodnot proměnné   a snažme se z toho něco zjistit o koeficientech v rovnosti výše. Když položíme postupně  , tak se rovnost redukuje do tvaru

 

Z prvních tří rovnic není těžké odvodit vztahy   a  . Když tyto dosadíme do rovnice čtvrté, tak obdržíme  . Po zpětném dosazení tedy vidíme, že jsou všechny koeficienty nulové a dané polynomy   jsou lineárně nezávislé. K tomuto zjištění jsme nemuseli procházet celou reálnou osu, ale stačilo dosadit čtyři konkrétní hodnoty nezávisle proměnné.

Mohli jsme ale vidět rovnou, že jsou dané koeficienty nulové. Na rovnici

 

se totiž můžeme dívat ve tvaru

 

Polynom na levé straně rovnosti je roven nulovému polynomu, ten má ale všechny koeficienty u svých mocnin nulové. Dostali bychom tak porovnáním odpovídajících koeficientů rovnou rovnice (levý sloupec v následující tabulce označuje mocninu, u které dané koeficienty v předchozí rovnici vystupují)

 

Tato soustava rovnic má zřejmě řešení  .

Příklad 3 — Komplexní funkce

editovat

Vektorový prostor například tvoří i komplexní funkce reálné proměnné, kde definujeme sčítání funkcí a jejich násobení bodově. Máme tedy množinu

 

Vezměme nyní tři funkce a ptejme se, zda jsou lineárně nezávislé, konkrétně funkce

 

Symbol i zde značí imaginární jednotku. V matematické analýze se dokazuje tzv. Eulerův vzorec, jenž zní

 

Když do výše uvedeného vzorce dosadíme místo proměnné   proměnnou  , tak nám přejde na tvar

 

kde jsme využili sudosti funkce   a lichosti funkce  . Sečteme-li výše uvedené vzorce, dostaneme

 

neboli

 

Kromě toho, že jsme nalezli jiné vyjádření pro funkci   jsme tak ještě navíc ukázali, že jsou funkce   lineárně závislé. Funkce   jde totiž vyjádřit pomocí zbylých dvou.

Příklad 4 — Závislost na tělese

editovat

Bereme-li vektorový prostor jen jako množinu bez vztahu ke svému tělesu, mohou být tytéž vektory lineárně závislé i lineárně nezávislé podle toho, nad jakým tělesem je daný vektorový prostor definován. Pro konkrétnost uvažujme prostor všech uspořádaných dvojic komplexních čísel, tj.  . V něm vyberme vektory

 

Zde symbol i značí imaginární jednotku. Tyto dva vektory jsou lineárně závislé, uvažujeme-li   jako vektorový prostor nad tělesem komplexních čísel, ale přitom lineárně nezávislé, uvažujeme-li   jako vektorový prostor nad tělesem reálných čísel. V prvním případě, když je těleso komplexní, totiž stačí vynásobit vektor   imaginární jednotkou a máme vektor  . Když ale uvažujeme těleso reálných čísel, pak podobnou operaci provést nemůžeme, neboť imaginární jednotka není reálné číslo. Zjevně neexistuje jiné reálné číslo, které by po vynásobení převedlo jeden vektor v druhý. Tyto dva vektory jsou tedy nad reálným tělesem lineárně nezávislé. Viz též Příklad 4 v článku Lineární obal.

Literatura

editovat
  • PYTLÍČEK, Jiří. Lineární algebra a geometrie. Praha: Česká technika - nakladatelství ČVUT, 2008. ISBN 978-80-01-04063-8.  – skripta FJFI ČVUT

Související články

editovat

Externí odkazy

editovat