November 26, 2017 | Author: danikaa3 | Category: N/A
Download Informatikai algoritmusok (ELTE).pdf...
INFORMATIKAI ALGORITMUSOK I.
Iványi Antal alkotó szerkeszt®
INFORMATIKAI ALGORITMUSOK I.
ELTE Eötvös Kiadó, Budapest, 2004
A könyv az Oktatási Minisztérium támogatásával, a Felsooktatási Pályázatok Irodája által lebonyolított felsooktatási tankönyvtámogatási program keretében jelent meg.
Iványi Antal Alkotó szerkeszto: Szerzok: Kása Zoltán (1.), Járai Antal és Kovács Attila (2.), Jörg Rothe (3. és 4.), Gyires Tibor (5.), Iványi Antal és Claudia Leopold (6.), Eberhard Zehendner (7.), Szidarovszky Ferenc (8.), Vizvári Béla (9.), Ulrich Tamm (10.), Balogh Ádám és Iványi Antal (11.), Demetrovics János és Sali Attila (12.), Miklós István (13.), Ingo Althöfer és Stefan Schwartz (14.), Szirmay-Kalos László (15.), Elek István és Sidló Csaba (16.), Galántai Aurél és Jeney András (17.) Szakmai lektorok: Fekete István (1.), Rónyai Lajos (2.), Gonda János (3.), Ivanyos Gábor (4.), (6. és 7.), Mayer János (8.), Csirik János (9.), Fridli Sándor (10.), Toke Pál (5.), Sima Dezso Varga László (11.), Kiss Attila (12.), Hunyadvári László és Katsányi István (13.), Szántai Tamás (14.), Vida János (15.), Meskó Attila (16.), Szántai Tamás (17.) Nyelvi lektor: Biró Gabriella Fordítók: Láng Zsuzsa (3.), Sidló Csaba (4.), Roszik János és Sztrik János (5.), Szakács Laura (7.), Pintér Miklós (8.), Sike Sándor (10.), Belényesi Viktor és Nikovits Tibor (14.) A könyv címoldalán a Szépmuvészeti Múzeum engedélyével és az ELTE Informatikai Karának támogatásával Vasarely Victor Dirac címu festménye látható. A borítóhoz felhasznált lmet a GOMA RT. bocsátotta rendelkezésünkre. A borítót Iványi Antal tervezte. c Ingo Althöfer, Balogh Ádám, Belényesi Viktor, Biró Gabriella, Csirik János, Demetrovics János,
Elek István, Fekete István, Fridli Sándor, Galántai Aurél, Gonda János, Gyires Tibor, Hunyadvári László, Iványi Anna, Iványi Antal, Ivanyos Gábor, Járai Antal, Jeney András, Katsányi István, Kása Zoltán, Kovács Attila, Láng Zsuzsa, Claudia Leopold, Locher Kornél, Lukács András, Mayer János, Meskó Attila, Miklós István, Nikovits Tibor, Pintér Miklós, Roszik János, Rónyai Lajos, Jörg Rothe, Sike Sándor, Szakács Laura, Szántai Tamás, Sali Attila, Stefan Schwarz, Sidló Csaba, Sima Dezso, Szidarovszky Ferenc, Szirmay-Kalos László, Sztrik János, Ulrich Tamm, Toke Pál, Varga László, Vida János, Vizvári Béla, Eberhard Zehendner, 2004 c Hungarian printed edition ELTE Eötvös Kiadó, 2004
ISBN: 963 463 664 0 Kiadja az ELTE Eötvös Kiadó 1051 Budapest, Szerb utca 21. Telefon: 411-6740, Fax: 485-52-26 Honlap: http://www.elte.hu/szervezet/eotvos_kiado.html Elektronikus cím:
[email protected] kiadó: Pándi András Felelos Nyomás és kötés: Debreceni Kinizsi Nyomda vezeto: Bördos János Felelos
Tartalomjegyzék
Tartalomjegyzék . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
Eloszó . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
I.
ALAPOK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
1.
Rekurzív egyenletek (Kása Zoltán) . . . . . . . . . . . . . . . . . . . . . . . .
14
1.1.
Lineáris rekurzív egyenletek
. . . . . . . . . . . . . . . . . . . . . . . . .
15
1.2.
Generátorfüggvények és rekurzív egyenletek . . . . . . . . . . . . . . . . .
22
1.3.
Numerikus megoldás
36
2.
3.
4.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
2.1.
Komputeralgebra (Járai Antal és Kovács Attila)
Adatábrázolás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
2.2.
Polinomok közös gyökei
. . . . . . . . . . . . . . . . . . . . . . . . . . .
44
2.3.
Gröbner-bázis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
2.4.
Szimbolikus integrálás
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
2.5.
Elmélet és gyakorlat
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
Kriptográa (Jörg Rothe) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
94
3.1.
Alapok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
3.2.
Kulcscsere Diffie és Hellman szerint . . . . . . . . . . . . . . . . . . . . .
107
3.3.
RSA és faktorizálás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
110
3.4.
Rivest, Rabi és Sherman protokolljai . . . . . . . . . . . . . . . . . . . . .
116
3.5.
Interaktív bizonyítási rendszerek és zéró ismeret . . . . . . . . . . . . . . .
116
Bonyolultságelmélet (Jörg Rothe) . . . . . . . . . . . . . . . . . . . . . . . . .
125
4.1.
Alapok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
126
4.2.
NP-teljesség . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
133
4.3.
Az ítéletlogika kielégíthetoség-problémája . . . . . . . . . . . . . . . . . .
139
4.4.
Grázomorzmus és alsóság . . . . . . . . . . . . . . . . . . . . . . . . .
144
6 II.
Tartalomjegyzék
HÁLÓZATOK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
162
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
163
5.
Hálózatok szimulációja (Gyires Tibor) . . . . . . . . . . . . . . . . . . . . . .
164
5.1.
A szimuláció típusai
164
5.2.
A telekommunikációs hálózatok modellezésének és szimulációjának szük-
5.3.
A telekommunikációs hálózatok típusai
5.4.
szimulációhoz Teljesítményjellemzok
5.5.
A forgalom jellemzése
ségessége
6.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
165
. . . . . . . . . . . . . . . . . . .
167
. . . . . . . . . . . . . . . . . . . .
169
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
172
5.6.
rendszerek . . . . . . . . . . . . . . . . . . . . . . Szimulációs modellezo
178
5.7.
Modellfejlesztési életciklus . . . . . . . . . . . . . . . . . . . . . . . . . .
189
5.8.
A forgalom ingadozásának hatása nagy sebességu hálózatokra
. . . . . . .
195
5.9.
Mérési adatok bemutatása . . . . . . . . . . . . . . . . . . . . . . . . . . .
210
. . . . . . . . . .
222
6.1.
Párhuzamos architektúrák . . . . . . . . . . . . . . . . . . . . . . . . . . .
224
6.2.
Hatékonysági mértékek és optimalizálás . . . . . . . . . . . . . . . . . . .
227
6.3.
Párhuzamos programozás . . . . . . . . . . . . . . . . . . . . . . . . . . .
235
6.4.
Számítási modellek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
242
6.5.
PRAM algoritmusok
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
244
Szisztolikus rendszerek (Eberhard Zehendner) . . . . . . . . . . . . . . . . .
268
7.1.
A szisztolika alapfogalmai
268
7.2.
Tér-ido-leképezés és szisztolikus rács
. . . . . . . . . . . . . . . . . . . .
278
7.3.
A be/kiviteli séma levezetése . . . . . . . . . . . . . . . . . . . . . . . . .
287
7.4.
Vezérlési szempontok . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
295
7.5.
Lineáris szisztolikus rácsok . . . . . . . . . . . . . . . . . . . . . . . . . .
306
FOLYTONOS OPTIMALIZÁCIÓ . . . . . . . . . . . . . . . . . . . . . . .
312
Eloszó . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
313
8.
. . . . . . . . . . . . . . . . . . . . . . .
314
8.1.
Véges játékok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
315
8.2.
Folytonos játékok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
320
8.3.
Az oligopol feladat
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
349
DISZKRÉT OPTIMALIZÁCIÓ . . . . . . . . . . . . . . . . . . . . . . . . .
362
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
363
9.
Ütemezéselmélet (Vizvári Béla) . . . . . . . . . . . . . . . . . . . . . . . . . .
364
9.1.
Formális rendszer ütemezési feladatok osztályozására . . . . . . . . . . . .
365
9.2.
A Gantt-diagramok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
368
9.3.
Ütemezési problémák egyetlen gépen
370
9.4.
Ütemezési problémák párhuzamos berendezéseken
9.5.
Az egyutas ütemezési probléma
9.6.
7.
III.
IV.
Párhuzamos számítások (Iványi Antal és Claudia Leopold)
. . . . . . . . . . . . . . . . . . . . . . . . . .
Játékelmélet (Szidarovszky Ferenc)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
378
. . . . . . . . . . . . . . . . . . . . . . .
389
A többutas ütemezési probléma . . . . . . . . . . . . . . . . . . . . . . . .
397
7
Tartalomjegyzék
V.
ADATBÁZISKEZELÉS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
416
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
417
10. Adattömörítés (Ulrich Tamm)
418
. . . . . . . . . . . . . . . . . . . . . . . . . .
10.1. Információelméleti eredmények
. . . . . . . . . . . . . . . . . . . . . . .
419
10.2. Aritmetikai kódolás és modellezés . . . . . . . . . . . . . . . . . . . . . .
429
10.3. ZivLempel tömörítés . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
440
10.4. BurrowsWheeler-transzformáció
. . . . . . . . . . . . . . . . . . . . . .
443
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
447
10.5. Képtömörítés
11. Memóriagazdálkodás (Balogh Ádám és Iványi Antal)
. . . . . . . . . . . . .
456
11.1. Partícionálás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
456
11.2. Lapcserélési algoritmusok
. . . . . . . . . . . . . . . . . . . . . . . . . .
470
11.3. Anomáliák . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
480
11.4. Állományok optimális elhelyezése . . . . . . . . . . . . . . . . . . . . . .
491
12. Relációs adatmodell tervezés (Demetrovics János és Sali Attila) . . . . . . . .
503
12.1. Bevezetés
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12.2. Funkcionális függoségek
. . . . . . . . . . . . . . . . . . . . . . . . . . .
12.3. Relációs sémák szétvágása
VI.
503 504
. . . . . . . . . . . . . . . . . . . . . . . . . .
511
12.4. Általános függoségek . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
530
ALKALMAZÁSOK
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
536
Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
537
13. Bioinformatika (Miklós István) . . . . . . . . . . . . . . . . . . . . . . . . . .
538
13.1. Algoritmusok szekvenciákon . . . . . . . . . . . . . . . . . . . . . . . . .
538
13.2. Algoritmusok fákon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
552
13.3. Algoritmusok sztochasztikus nyelvtanokon
. . . . . . . . . . . . . . . . .
554
13.4. Szerkezetek összehasonlítása . . . . . . . . . . . . . . . . . . . . . . . . .
560
13.5. Törzsfakészítés távolságon alapuló algoritmusokkal . . . . . . . . . . . . .
562
13.6. Válogatott témák
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
572
14. Ember-gép kölcsönhatás (Ingo Althöfer és Stefan Schwarz) . . . . . . . . . .
580
14.1. Több választási lehetoséget kínáló rendszerek . . . . . . . . . . . . . . . .
580
14.2. Több lehetséges megoldás eloállítása . . . . . . . . . . . . . . . . . . . . .
584
14.3. További interaktív problémamegoldó algoritmusok
. . . . . . . . . . . . .
600
15. Számítógépes graka (Szirmay-Kalos László) . . . . . . . . . . . . . . . . . .
605
15.1. Analitikus geometriai alapok . . . . . . . . . . . . . . . . . . . . . . . . .
605
15.2. Ponthalmazok leírása egyenletekkel
. . . . . . . . . . . . . . . . . . . . .
606
15.3. Geometriai feldolgozó és tesszellációs algoritmusok . . . . . . . . . . . . .
618
15.4. Tartalmazási algoritmusok
628
. . . . . . . . . . . . . . . . . . . . . . . . . .
15.5. Mozgatás, torzítás, geometriai transzformációk
. . . . . . . . . . . . . . .
637
15.6. Megjelenítés sugárkövetéssel . . . . . . . . . . . . . . . . . . . . . . . . .
645
15.7. Az inkrementális képszintézis algoritmusai
662
. . . . . . . . . . . . . . . . .
8
Tartalomjegyzék
16. Térinformatika (Elek István és Sidló Csaba)
. . . . . . . . . . . . . . . . . .
685
16.1. A térinformatika adatmodelljei . . . . . . . . . . . . . . . . . . . . . . . .
685
16.2. Térbeli indexelés
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
687
16.3. Digitális szurési eljárások . . . . . . . . . . . . . . . . . . . . . . . . . . .
694
16.4. Mintavételezés
710
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17. Tudományos számítások (Galántai Aurél és Jeney András)
. . . . . . . . . .
717
17.1. Lebegopontos aritmetika és hibaelemzés . . . . . . . . . . . . . . . . . . .
717
17.2. Lineáris egyenletrendszerek
. . . . . . . . . . . . . . . . . . . . . . . . .
727
17.3. Sajátértékszámítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
748
17.4. Numerikus programkönyvtárak és szoftvereszközök . . . . . . . . . . . . .
758
Irodalomjegyzék . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
769
Tárgymutató . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
787
Színes ábrák és ismertetok
799
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El®szó
Az informatikai algoritmusok magyar nyelvu szakirodalma az utóbbi huszonöt évben ala szakkönyvet Lovász László és Gács Péter írta 1978-ban [295]. Ezt a könykult ki. Az elso vet fordítások követték: 1982-ben Aho, Hopcroft és Ullman [6] könyve, 1987-ben Knuth háromkötetes monográája [258, 259, 260], majd 1987-ben Cormen, Leiserson és Rivest következtek Rónyai Lajos, Ivanyos Gábor és muve [89]. 1999-ben újra hazai szerzok Szabó Réka [392] majd 2002-ben megjelent Lynch Osztott algoritmusok címu monográája [301]. Ezt 2003 tavaszán Iványi Antal Párhuzamos algoritmusok címu könyve [221], majd 2003 oszén Új algoritmusok címmel Cormen, Leiserson, Rivest és Stein tankönyvének [90] fordítása követte. A magyar informatikus hallgatók és gyakorlati szakemberek nagy érdeklodéssel fogadták az Új algoritmusokat néhány hónap alatt a kiadott 2000 példány fele gazdára talált. Ez ösztönözte ennek a könyvnek a hazai szerzoit, hogy külföldi kollégáik segítségével további informatikai területek algoritmusait is összefoglalják. A könyv tartalmát hat részre tagoljuk: Alapok, Hálózatok, Diszkrét optimalizálás, Folytonos optimalizálás, Adatbázisok és Alkalmazások. kötetbe azok a fejezetek került, amelyek szeptemberig elkészültek. Minden Az elso fejezet bemutat egy alkalmazási vagy elméleti szempontból lényeges területet és azokhoz kapcsolódó algoritmusokat. Az algoritmusok többségét szóban és olyan pszeudokóddal is olvasók számára könnyen értmegadjuk, amely a programozási tapasztalattal rendelkezo heto. kötet 247 ábrát, 157 pszeudokódot és 133 példát tartalmaz, amelyek elose Az elso gítik a tárgyalt algoritmusok muködésének megértését. Az önálló tanulást az alfejezetek gyakorlatok (összesen 269), az egyes témákban való elmélyülést pedig a fejevégén lévo (összesen 66) feladatok segítik. A fejezetek anyagával kapcsolatos friss zetek végén lévo ismeretekre való utalások találhatók a fejezetek végén lévo Megjegyzések a és kiegészíto fejezethez címu részben. Az irodalomjegyzékben megadjuk egyrészt a felhasznált szakirodalom bibliográai adatait, másrészt teljességre törekedve felsoroljuk a magyar nyelvu forrásokat. és memóAz algoritmusok bemutatása az igényelt eroforrások elsosorban futási ido korlátoria elemzését is magában foglalja. A szakirodalomban szokásos módon felso eroforrásigényre, kat adunk meg a legrosszabb esetre jellemzo és esetenként a megoldandó alsó korlátot is levezetünk. probléma eroforrásigényére jellemzo AT X kiadványszerkeszto eszköz segítségével készítettük, amelyet A könyv kéziratát HL E
10
Eloszó
az elmúlt hat év során Belényesi Viktorral és Locher Kornéllal fejlesztettünk ki, és korábban már három könyv kéziratának eloállítására használtunk. Az ábrák többségét Locher Kornél rajzolta. Az irodalomjegyzéket Iványi Anna tette élové. Garey és Johnson klasszikus muvét [149] követve mindazon algoritmusok futási idejét korlát. exponenciálisnak nevezzük, amelyekre nem adható polinomiális felso Az Új algoritmusok példáját követve tizedespontot használunk. Mindig különös gondot fordítunk könyveink külsejére. Az adott esetben olyan megoldást kerestünk, amely
•
kötet 17 és a második kötet hasonló számú tükrözi a könyv tartalmi gazdagságát (az elso fejezetét)
•
és az alkotók szoros kötodését mind Magyarországhoz, mind pedig Európához. Úgy gondoljuk, hogy a pécsi születésu Vásárhelyi Viktor aki francia festoként Victor
a formák és színek gazdagsága, életútja Vasarely néven vált világhíruvé képeire jellemzo pedig tükrözi kultúránk európai kötodését. A budapesti és pécsi múzeumokban összesen közel 500 Vasarely-alkotás van. Ezek a muvész ajándékai a szüloföld iránti hála és tisztelet szimbólumai. Vasarely gazdag élet a könyv alkotói és majdani olvasói segítségével választottunk. A szavazók a Dirac, muvéb ol Kubtuz, Rikka, Sixa és a Tupa-fond címu képeket emelték ki. Közülük két olyan képet a Dirac és a Kubtuz címu festményeket választottuk, amelyeken szakaszokból kör alakul ki tulajdonságát, hogy a folytonos valós világot szemléltetve az informatika azon alapveto diszkrét objektumokkal (bitekkel) írja le és amelyekhez sikerült felhasználási engedélyt kapnunk. Közismert, hogy az elmúlt évszázadban nemcsak muvészeink, hanem sok kiváló tudósunk is külföldön ért fel a csúcsra. Nagy részükre azonban folyamatosan számíthat a hazai oktatás és tudományos élet. A hálózati szimulációs fejezet szerzoje Gyires Tibor (Illinois Egyetem), a játékelméleti fejezetet pedig Szidarovszky Ferenc (Arizonai Muszaki Egyetem) írta. A második kötetben a megbízhatóságról szóló fejezetet Gács Péter (Bostoni Egyetem) szóló fejezet egyik szerzoje írta, a belsopontos módszerekrol pedig Terlaky Tamás (McMas az adott terület vezeto kutatója, amerikai egyetemek ter Egyetem). Ma mind a négy szerzo professzora egykor magyar egyetemen tanultak, majd tanítottak. A rekurziós fejezet szerzoje Kása Zoltán (Babe¸ s-Bolyai Tudományegyetem), a sziszto szóló fejezetet Szakács Laura (Babe¸ likus rendszerekrol s-Bolyai Tudományegyetem) fordí magyarra. Részvételük a könyv megszületésében a határainkon túli magyar totta németrol nyelvu oktatással való szoros kapcsolatunk része. Könyvünk tartalmi gazdagsága jó külföldi elsosorban német kapcsolatainknak Az elso kötet kriptográai és bonyolultságelméleti fejezetét Jörg Rothe is köszönheto. (Düsseldor Egyetem), szisztolikus rendszerekkel foglalkozó fejezetét Eberhard Zehendner (Friedrich Schiller Egyetem) írta. Az adattömörítési fejezet szerzoje Ulrich Tamm (Chem nitzi Egyetem), a párhuzamos programozásról szóló fejezet egyik szerzoje Claudia Leopold Ingo Althöfer (Kasseli Egyetem), az ember-gép kapcsolatokkal foglalkozó fejezet szerzoi és Stefan Schwartz (Friedrich Schiller Egyetem). Az alkotók (szerzok, lektorok, fordítók és segítotársaik) többsége a hazai informatikai felsooktatás meghatározó intézményeinek Budapesti Corvinus Egyetem, Budapesti Mu szaki és Gazdaságtudományi Egyetem, Budapesti Muszaki Foiskola, Debreceni Egyetem, Eötvös Loránd Tudományegyetem, Miskolci Egyetem, Pécsi Tudományegyetem, Szegedi
11
Eloszó
Tudományegyetem oktatója. Az Oktatási Minisztérium támogatásának köszönhetoen ez a tankönyv nagyon kedvezo áron juthat el az Olvasókhoz. Ugyancsak az Oktatási Minisztérium támogatásának köszön hogy 2005 tavaszától a könyv elektronikus változata is mindenki számára szabadon heto, lesz. hozzáférheto Az alábbi kollégáknak köszönjük, hogy a tervezett könyv mindkét formáját támogatták: Fazekas Gábor egyetemi docens (Debreceni Egyetem Informatikai Karának dékánhelyettese), Imreh Balázs egyetemi docens (Szegedi Egyetem), Kása Zoltán egyetemi tanár (BBTE Matematikai és Informatikai Karának dékánhelyettese), Kozma László egyetemi docens (ELTE Informatikai Karának dékánja), Jörg Rothe egyetemi tanár (Heinrich Heine foiskolai Universität, Düsseldorf), Sima Dezso tanár (Budapesti Muszaki Foiskola Neu mann János Informatikai Karának foigazgatója), Sidló Csaba PhD hallgató (ELTE Informatikai Doktori Iskola), Szeidl László egyetemi tanár (Pécsi Tudományegyetem Matematikai és Informatikai Intézet igazgatója), Szidarovszky Ferenc egyetemi tanár (Arizonai Muszaki Egyetem), Szirmay-Kalos László egyetemi tanár (BME Villamosmérnöki és Informatikai Kara), Terlaky Tamás egyetemi tanár (McMaster Egyetem, Hamilton) Ugyancsak köszönjük azoknak a kollégáinknak a segítokészségét, akiknek a lektori véleményét csatolni tudtuk a pályázathoz: Fekete István egyetemi docens (Rekurziók címu fejezet), Fridli Sándor egyetemi docens (Adattömörítés), Gonda János egyetemi docens (Kriptográa), Hunyadvári László egyetemi docens és Katsányi István PhD hallgató (Bioinfor matika), Kiss Attila egyetemi docens (Relációs adatbázisok tervezése), Toke Pál egyetemi docens (Hálózatok szimulációja), Vida János egyetemi docens (Graka). Az elektronikus változat elkészültéig a
http://people.inf.elte.hu/tony/konyvek/infalg címu honlapon találják meg olvasóink a könyv kiegészítését, amely többek között az élo irodalomjegyzéket, a névmutatót, a gyakorlatok és feladatok egy részének megoldását, mu programokat, a talált hibák jegyzékét tartalmazza. Ezen a honlapon keresztül fogjuk ködo Olvasóinkat tájékoztatni az elektronikus változat hálózati címérol. Köszönet illeti azokat Belényesi Viktor, Thomas H. Cormen, Érsek Nándor, Pavel Fabian, Johan Gade, Iványi Anna, Kimo Johnson, Shamir Kuller, Lorentey Károly, Stefan Schumann, Joel Seiferas, Beau Skinner, Ofer Springer, George Stephanides, Sekar Sundarraj, Szántai Tamás, Szeidl László, Ronald Tungl, Veszprémi Anna, David Wagner akik kiaészrevételeikkel segítettek a könyvünk alapjául szolgáló mu, az Új algoritmusok elso dásának javításában. Az elozetes érdeklodés alapján arra számítunk, hogy rövidesen újabb kiadásra lesz kiadás hibáit kijavítani. Ezért kérjük a könyv Olvasóit, szükség. Ebben szeretnénk az elso hogy javaslataikat, észrevételeiket küldjék el a
[email protected] címre levelükben le-
hetoleg pontosan megjelölve a hiba elofordulási helyét, és megadva a javasolt szöveget. és lektorok elektronikus címeit tartalmazó A könyv honlapján megtalálható a szerzok kolofonoldal. Olvasóink javaslataikkal, kérdéseikkel megkereshetik a könyv alkotóit. Budapest, 2004. szeptember 22. Iványi Antal alkotó szerkeszto
I. ALAPOK
Bevezetés
Ebben az alapozó részben négy témakört tárgyalunk. Az informatikai algoritmusok elemzése során gyakran elofordul, hogy például felismerjük az n és n
+ 1 méretu feladatok megoldási ideje közötti kapcsolatot és ennek az úgy-
nevezett rekurzív egyenletnek a felhasználásával szeretnénk közvetlenül felírni az n méretu Az elso fejezet a rekurzív egyenletek leggyakrabban elofor bemenethez tartozó futási idot. duló típusainak megoldási módszereit mutatja be. A mai számítógépek sebessége és tárolókapacitása, valamint az elméleti eredmények számos olyan feladat kényelmes (mechanikus) megoldását lehetové teszik, melyeket korábban nem, vagy csak nagy nehézségek árán tudtunk kezelni. Ezek egy része mint a formális differenciálás és integrálás a második fejezetben tárgyalt komputeralgebrához tartozik. a kommunikáció Az elektronikus kommunikáció hatalmas iramú terjedésével együtt no biztonságának jelentosége. Ezért a mai informatika egyik kulcsfontosságú területe a kriptográa, mellyel a könyv harmadik fejezete foglalkozik. Az algoritmusok elemzésének hagyományosan fontos része az eroforrásigény leg korlátjának megadása. Az csak az utóbbi 15 évben vált rosszabb esetre vonatkozó felso természetessé, hogy az eroforrásigényre vonatkozó a probléma és a megengedett algoritmusok tulajdonságain alapuló alsó korlátokat is megadnak. Például Donald Knuth The Art of Computer Programming címu monográájának 1968 kötetében szerepelt az aszimptotikus felso korlátok jellemzésére használt ban megjelent elso O-jelölés (nagy ordo) deníciója ugyanakkor még nem szerepelt az alsó korlátok jellemzésére alkalmas
Ω-jelölés, valamint a pontos nagyságrend megadására alkalmas Θ-jelölés. Az
kiadásában, a Distributed Algorithms Introduction to Algorithms 1990-ben megjelent elso kiadásában, valamint Knuth könyvének 1997-ben megjelent har1996-ban megjelent elso madik kiadásában már az
Ω-jelölés és a Θ-jelölés deníciója is szerepel.
A negyedik fejezet szerint a bonyolultságelmélet fontos feladata, hogy a problémákhoz és számítási modellekhez minél pontosabb alsó korlátokat adjon meg ezzel is segítve a problémák eroforrásigény szerinti osztályozását. A második kötetben fog megjelenni az algebrai algoritmusok elemzése.
1. Rekurzív egyenletek
Közismert a Fibonacci-számok rekurzív deníciója: ha F n jelöli az n-edik Fibonacciszámot, akkor F0 F n+2
=
= 0,
F n+1
F1
=1,
+ Fn ,
ha n
≥0.
Szeretnénk explicit formában megadni F n értékét tetszoleges n-re. A feladat tulajdonképpen olyan egyenlet megoldását kéri, amelyben az ismeretlen rekurzív módon van megadva, ezért rekurzív egyenletnek hívjuk. Itt a megoldás felfogható úgy, mint természetes számokon értelmezett függvény, mivel F n minden n-re értelmezett. Az ilyen rekurzív egyenletet szokás még differenciaegyenletnek is nevezni, de nevezhetnénk akár diszkrét differenciálegyenletnek is. 1.1. deníció. A k-adrendu rekurzív egyenlet (k f (xn , xn+1 , . . . , , xn+k )
≥ 1) egy = 0,
n
≥0
(1.1)
alakú egyenlet, ahol xn -et kell explicit formában megadnunk. Ahhoz, hogy egyértelmuen meghatározhassuk xn -et, meg kell adnunk k kezdoértéket, ezek általában x0 , x1 , . . . , xk−1 . Ezek az értékadások kezdeti feltételeknek tekinthetok. Mivel a Fibonacci-számokat deniáló egyenlet másodrendu rekurzív egyenlet, ezért ott két kezdeti értéket adunk meg. xn Az (1.1) egyenletet és annak adott kezdeti feltételeit kielégíto adott egyenlet partikuláris megoldásának nevezzük. Ha az xn
=
=
g(n) sorozatot az
h(n, C 1 , C 2 , . . . , C k ) soro-
zatból a C 1 , C 2 , . . . , C k állandók alkalmas megválasztásával az (1.1) egyenlet minden partikuláris megoldása eloállítható, akkor a sorozatot az egyenlet általános megoldásának nevezzük. A rekurzív egyenletek megoldása általában nem egyszeru. A következokben sajátos esetekben alkalmazható módszereket ismertetünk. Az írásmódban függvény helyett inkább sorozatot használunk (ami tulajdonképpen természetes számokon értelmezett függvény). Így a jelölés egyszerubb lesz, x(n) helyett mindenhol xn -t írunk. áll. Az 1.1. alfejezetben a lineáris rekurzív egyenletek megA fejezet három részbol oldásával, a 1.2. alfejezetben a generátorfüggvények felhasználásával, az 1.3. alfejezetben pedig lineáris rekurzív egyenletek numerikus megoldásával foglalkozunk.
15
1.1. Lineáris rekurzív egyenletek
1.1. Lineáris rekurzív egyenletek Ha a rekurzív egyenlet f0 (n)xn
+
f1 (n)xn+1
+ ··· +
fk (n)xn+k
=
f (n),
n
≥0
alakú, ahol f , f0 , f1 , . . . , fk természetes számokon értelmezett függvények, f0 , fk
,
0, és
beszélünk. Ha xn -et kell explicit módon megadnunk, akkor lineáris rekurzív egyenletrol f azonosan nulla, akkor az egyenlet homogén, és különben inhomogén. Amennyiben az f0 , f1 , . . . , fk függvények mindegyike állandó, akkor állandó együtthatós lineáris rekurzív van szó. egyenletrol
1.1.1. Állandó együtthatós homogén lineáris rekurzív egyenletek Legyen a0 xn
+ a1 xn+1 + · · · + ak xn+k = 0,
ahol a0 , a1 , . . . , ak valós állandók, a0 , ak
, 0,
k
≥
n
≥k,
(1.2)
1. Amennyiben adva van k kezdeti érték
(leggyakrabban x0 , x1 , . . . , xk−1 ), az egyenlet megoldása egyértelmuen meghatározható. A megoldás érdekében rendeljük hozzá az egyenlethez a karakterisztikus egyenletét: a0
+ a1 r + · · · + ak−1 rk−1 + ak rk = 0 ,
(1.3)
amely valós együtthatós egyenlet. Ennek az egyenletnek k gyöke van a komplex számok hogy ha r0 valós megoldása a karakterisztikus körében. Behelyettesítéssel ellenorizhet o, egyenletnek, akkor C 0 r
n 0
megoldása az (1.2) egyenletnek, ahol C 0 tetszoleges állandó.
Az (1.2) egyenlet általános megoldása xn (i)
ahol xn (i
= C1 xn(1) + C2 xn(2) + · · · + Ck xn(k) ,
= 1, 2, . . . , k) az (1.2) egyenlet lineárisan független megoldásai. A kezdeti felté-
mindig meghatározhatók a C 1 , C 2 , . . . , C k állandók egy k egyenletbol álló egyentelekbol letrendszer megoldásával. A lineárisan független megoldásokat a karakterisztikus egyenlet gyökei szolgáltatják szerint. Minden gyökhöz hozzárendelheto egy fundamentálisnak nevezett a következok megoldás. valós gyökök Különbözo valós gyökei. EkLegyenek r1 , r2 , . . . , r p a karakterisztikus egyenlet egymástól különbözo kor n
n
r1 , r2 ,
...,
n
rp
megoldásai az (1.2) rekurzív egyenletnek, és n
C 1 r1 is az, tetszoleges C1 , C2 , általános megoldása.
...,
+ C2 r2n + · · · + C p rnp
C p állandókra. Ha p
=
(1.4)
k, akkor (1.4) a rekurzív egyenlet
16
1. Rekurzív egyenletek
1.1. példa. Oldjuk meg az
=
xn+2
+ xn ,
xn+1
x0
= 0,
x1
=1
rekurzív egyenletet. A karakterisztikus egyenlet r
−r−1=0 ,
2
amelynek gyökei
=
r1
1
√
+
5
2
,
r2
=
1
√
−
5
.
2
Ezek valósak és egymástól különböznek, tehát az egyenlet általános megoldása
xn
√ n √ n 1 + 5 1 − 5 + C2 . = C1 2
2
Ha gyelembe vesszük, hogy x0 A C 1 és C 2 meghatározhatók a kezdeti feltételekbol.
=
0, x1
=
1, a
egyenletrendszerhez jutunk: következo
C1
+ C2 √ − 5
C1
√
+
1
5
+ C2
2
1
2
=
0
,
=
1
.
√ √ = 1/ 5, C2 = −1/ 5 . Így az általános megoldás √ n √ n 1 1 1 + 5 1 − 5 = √ − √ ,
Az egyenletrendszer megoldása C 1
xn
2
5
2
5
amely éppen F n , az n-edik Fibonacci-szám.
Többszörös valós gyökök Legyen r egy p-szeres gyöke a karakterisztikus egyenletnek. Ekkor r
n
,
nr
n
,
2 n
n r
, ...,
n
p−1 n
r
megoldásai az (1.2) rekurzív egyenletnek (az r többszörös gyökhöz tartozó fundamentális megoldások), és C0
+ C1 n + C2 n2 + · · · + C p−1 n p−1
is megoldás, tetszoleges C0 , C1 ,
...,
r
n
C p−1 állandókra. Ha a karakterisztikus egyenletnek
nincs más gyöke, akkor (1.5) a rekurzív egyenlet általános megoldása. 1.2. példa. Oldjuk meg az xn+2
= 4xn+1 − 4xn ,
x0
= 1,
rekurzív egyenletet. A karakterisztikus egyenlet r amelynek r
2
− 4r + 4 = 0 ,
= 2 kétszeres gyöke. Ekkor xn
megoldása az egyenletnek.
(1.5)
= (C0 + C1 n)2n
x1
=3
17
1.1. Lineáris rekurzív egyenletek
A kezdeti feltételekbol
2C 0 Innen C 0
C0
=
1
,
+ 2C1
=
3
.
= 1, C1 = 1/2, azaz az általános megoldás =
xn
1
+
1 2
! n
n 2
vagy
= (n + 2)2n−1 .
xn
Egyszeres komplex gyökök Ha a trigonometrikus alakban felírt a(cos b + i sin b) komplex szám gyöke a karakterisztikus egyenletnek, akkor az a(cos b
−
i sin b) konjugált is az, mivel a karakterisztikus egyenlet
valós együtthatós. Ekkor n
a cos bn
és
n
a sin bn
megoldása az (1.2) rekurzív egyenletnek és n
C 1 a cos bn
+ C2 an sin bn
(1.6)
is az, tetszoleges C 1 és C 2 állandókra. Ha a karakterisztikus egyenletnek nincsenek más gyökei, akkor (1.6) általános megoldás. 1.3. példa. Oldjuk meg az xn+2
= 2xn+1 − 2xn ,
= 0,
x0
x1
=1
rekurzív egyenletet. A karakterisztikus egyenlet
r
amelynek gyökei 1
2
− 2r + 2 = 0 ,
+ i és 1 − i, trigonometrikus alakban:
√
2(cos(π/4)
i sin(π/4)). Ezért a rekurzív egyenletnek
xn
= C1 (
√
n
2) cos
nπ
+ C2 (
4
√
n
2) sin
nπ 4
megoldása. A kezdeti feltételekbol
√ C1
Innen azt kapjuk, hogy C 1
= 0,
C2
2 cos
π 4
+ C2
C1
√
2 sin
π 4
=
0
,
=
1
.
= 1. Az általános megoldás tehát xn
=
√ n 2
sin
nπ 4
.
+ i sin(π/4)) és
√
2(cos(π/4)
−
18
1. Rekurzív egyenletek
Többszörös komplex gyökök Ha a trigonometrikus alakban felírt a(cos b + i sin b) komplex szám p-szeres gyöke a karak-
− i sin b) konjugált is az.
terisztikus egyenletnek, akkor az a(cos b Ekkor az (1.2) rekurzív egyenletnek n
n
...,
n
n
...,
n
a cos bn, na cos bn, és n
a sin bn, na sin bn,
p−1
p−1
n
a cos bn
n
a sin bn
megoldásai. Ekkor megoldás (C 0
+ C1 n + · · · + C p−1 n p−1 )an cos bn + (D0 + D1 n + · · · + D p−1 n p−1 )an sin bn
is, ahol C 0 , C 1 , . . . , C p−1 , D0 , D1 , . . . , D p−1 tetszoleges állandók, amelyek meghatározhatók Ez általános megoldás, ha a karakterisztikus egyenletnek nincsenek a kezdeti feltételekbol. más gyökei. 1.4. példa. Oldjuk meg az xn+4
+ 2xn+2 + xn = 0,
x0
= 0,
x1
= 1,
x2
= 2,
x3
=3
rekurzív egyenletet. A karakterisztikus egyenlet r amely (r
2
4
+ 2r2 + 1 = 0 ,
+ 1)2 = 0 alakban is írható, és amelynek i és −i kétszeres gyöke. Ezek trigonometrikus alakja i
= cos
π 2
π + i sin , 2
− i = cos
valamint
π 2
− i sin
π 2
Ezért az általános megoldás xn
= (C0 + C1 n) cos
nπ 2
+ (D0 + D1 n) sin
nπ 2
.
következik: A kezdeti feltételekbol
(C 0
+ C1 ) cos
π 2
C0
+ (D0 + D1 ) sin
π 2
+ 2C1 ) cos π + (D0 + 2D1 ) sin π 3π 3π (C 0 + 3C 1 ) cos + (D0 + 3D1 ) sin (C 0
2
2
=
0
,
=
1
,
=
2
,
=
3
,
azaz
=
0
,
+ D1
=
1
,
−2C1
=
2
,
−D0 − 3D1
=
3
,
D0
és innen C 0
C0
= 0, C1 = −1, D0 = 3 és D1 = −2. Az általános megoldás tehát xn
= (3 − 2n) sin
nπ 2
− n cos
nπ 2
.
.
19
1.1. Lineáris rekurzív egyenletek
A most vizsgált négy eset segítségével bármilyen állandó együtthatós homogén egyenletet megoldhatunk. 1.5. példa. Oldjuk meg az xn+3
= 4xn+2 − 6xn+1 + 4xn ,
x0
= 0,
x1
= 1,
x2
=1
rekurzív egyenletet. A karakterisztikus egyenlet r
3
− 4r2 + 6r − 4 = 0 ,
+ i és 1 − i. Ezért az általános megoldás √ n √ n nπ nπ n + C3 2 sin . xn = C 1 2 + C 2 2 cos
amelynek gyökei: 2, 1
4
4
Az állandók meghatározása után
xn
n−1
= −2
+
√ n 2 2
cos
nπ 4
nπ
+ 3 sin
.
4
Általános megoldás Az
(1.2)
k-adrendu
homogén
lineáris
rekurzív
egyenlethez
rendelt
karakterisztikus
egyenletnek összesen k gyöke van a komplex számok között, amelyek nem feltétlenül különbözok. Legyenek ezek a gyökök a következok: r1 valós, p1 -szeres ( p1 r2 valós, p2 -szeres, ( p2
≥ 1) ≥ 1)
, ,
...
≥ 1) , = a1 (cos b1 + i sin b1 ) komplex, q1 -szeres (q1 ≥ 1) = a2 (cos b2 + i sin b2 ) komplex, q2 -szeres (q2 ≥ 1)
rt valós, pt -szeres, ( pt s1 s2
, ,
... sm
= am (cos bm + i sin bm ) komplex, qm -szeres (qm ≥ 1)
Mivel összesen k gyök van, p1
.
+ p2 + · · · + pt + 2(q1 + q2 + · · · + qm ) = k.
Ekkor az (1.2) rekurzív egyenlet általános megoldása
xn
t X
=
C
( j) 0
+ C1( j) n + · · · + C (pj)−1 n p −1
+
( j)
D
0
+ D(1j) n + · · · + D(qj)−1 nq −1
+
E
( j) 0
+ E1( j) n + · · · + Eq( j)−1 nq −1
j=1
ahol C
( j) 0
,
C
( j) 1
, ...,
C
( j) p j −1
,
j
j
j
j=1 m X
= 1, 2, . . . , t ,
j
j
n
rj
j
j=1 m X
j
n
a j cos b j n
n
a j sin b j n
,
(1.7)
20
1. Rekurzív egyenletek
(l)
D
0
,
E
(l) 0
,
(l)
D
1
,
E
(l) 1
, ...,
meghatározhatók. feltételekbol
(l)
D
pl −1
,
E
(l) pl −1
,
= 1, 2, . . . , m
l
állandók, melyek a kezdeti
tételben foglalhatók össze. Az eddigiek a következo 1.2. tétel. Legyen k
≥
1 egész, a0 , a1 ,
. . . , ak
valós számok, a0 , ak
, 0.
Az (1.2) lineá-
ris rekurzív egyenlet általános megoldása eloállítható az (17.39) karakterisztikus egyenlet j n
ri gyökeibol képezett n ri alakú tagok lineáris kombinációjaként, ahol a pi -szeres ri gyök esetében 0
≤ j<
p és a lineáris kombináció együtthatói a kezdeti feltételektol függnek.
A tétel bizonyítását az Olvasóra hagyjuk (lásd 1.1-5. gyakorlat). A megoldás lépéseit a következoképpen foglalhatjuk össze. Feltesszük, hogy az egyenlet együtthatóit az A tömb, a megoldás állandóit pedig a C tömb tartalmazza. H ´ - ´ 1
írjuk fel a rekurzív egyenlet karakterisztikus egyenletét
2
keressük meg a karakterisztikus egyenlet összes gyökét, multiplicitásukkal együtt
3
írjuk fel az (1.7) általános megoldást a gyökök alapján
4
ha léteznek, határozzuk meg az (1.7)-ben szereplo állandókat a kezdeti feltételekbol,
1.1.2. Állandó együtthatós inhomogén lineáris rekurzív egyenletek Az állandó együtthatós inhomogén lineáris rekurzív egyenlet általános alakja a0 xn
+ a1 xn+1 + · · · + ak xn+k =
ahol a0 , a1 , . . . , ak valós állandók, a0 , ak
, 0,
k
≥ 1, és
f (n)
,
(1.8)
f (n) nem azonosan nulla.
Az egyenlethez tartozó (1.2) homogén lineáris egyenletet az 1.2. tétel szerint meg tudjuk oldani. Ha ismerjük az (1.8) egyenlet egy partikuláris megoldását, akkor az (1.8) egyenlet tudjuk állítani. általános megoldását is elo 1.3. tétel. Legyen k
≥
1 egész, a0 , a1 ,
. . . , ak
valós számok, a0 , ak
lineáris inhomogén rekurzív egyenlet egy partikuláris megoldása és
tartozó (1.2) homogén lineáris egyenlet általános megoldása, akkor xn
=
(0)
xn
+ xn(1)
általános megoldása az (1.8) egyenletnek. A tétel bizonyítását meghagyjuk az Olvasónak (lásd 1.1-6. gyakorlat). 1.6. példa. Oldjuk meg az xn+2
+ xn+1 − 2xn = 2n ,
x0
= 0,
rekurzív egyenletet. Eloször megoldjuk az xn+2
+ xn+1 − 2xn = 0
x1
=1
, 0.
(0) xn
(1)
Ha xn
az (1.8)
az (1.8) egyenlethez
21
1.1. Lineáris rekurzív egyenletek
(1)
f (n)
xn
n a
p
n
(C 0
+ C1 n + · · · + C p n p )an
n
p
(C 0
+ C1 n + · · · + C p n p )an sin bn + (D0 + D1 n + · · · + D p n p )an cos bn
n
p
(C 0
+ C1 n + · · · + C p n p )an sin bn + (D0 + D1 n + · · · + D p n p )an cos bn
a n sin bn
a n cos bn
1.1. ábra. A partikuláris megoldás alakja.
homogén egyenletet, amelynek általános megoldása
= C1 (−2)n + C2 ,
(0)
xn
(1)
mivel a karakterisztikus egyenlet gyökei −2 és 1. Könnyen ellenorizhetjük, hogy xn
= 2n−2 megoldása
az eredeti, inhomogén egyenletnek. Az inhomogén egyenlet általános megoldása tehát xn
= C1 (−2)n + C2 + 2n−2 .
Ennek alapján az általános megoldás A C 1 és C 2 állandókat meghatározhatjuk a kezdeti feltételekbol.
xn
=−
1 4
(−2)
n
(
azaz xn
=
+ 2n−2
vagy
0,
xn
ha n páros
n−1
2
,
2
=
n
− (−2)n 4
,
,
ha n páratlan
.
A partikuláris megoldás meghatározható a konstansok variálásának módszerével. Léteznek azonban olyan esetek, amikor a partikuláris megoldást könnyebben is megkaphatjuk. (1)
Az 1.1. ábrán olyan f (n) függvényeket adunk meg, amelyek esetében az xn
partikuláris
Az állandókat az egyenletbe való bemegoldás a táblázatban megadott alakban keresheto. helyettesítéssel kaphatjuk meg.
= 2n , tehát az elso esetet alkalmazzuk, amikor a = 2, p = -nel próbálkozunk. Behelyettesítés után azt kapjuk, hogy C 0 = 1/4, tehát a
o példánk esetében f (n) Eloz 0, ezért a C 0 2
n
partikuláris megoldás (1)
xn
= 2n−2 .
Gyakorlatok 1.1-1. Oldjuk meg az alábbi inhomogén lineáris rekurzív egyenletet: Hn
= 2Hn−1 + 1,
ha n
≥ 1,
és
H0
=0.
22
1. Rekurzív egyenletek
(Hn itt a Hanoi-tornyai nevu feladat megoldásához szükséges és egyben elégséges lépések számát jelenti.) 1.1-2. Elemezzük a Hanoi-tornyaira vonatkozó feladatot abban az esetben, amikor úgy kell n korongot átrakni az A rúdról a C rúdra, hogy közben az A rúdról a C rúdra nem szabad korongot átrakni. Útmutatás. Mutassuk meg, hogy ha az optimális algoritmus lépéseinek száma Mn és n
≥ 1, akkor Mn = 3Mn−1 + 2.
rekurzív egyenletet: 1.1-3. Oldjuk meg a következo (n
+ 1)Rn = 2(2n − 1)Rn−1 ,
≥ 1,
ha n
és
R0
= 1.
1.1-4. Oldjuk meg alábbi inhomogén lineáris rekurzív egyenletet:
= 2n − 2 + 2xn−1 ,
xn
ha n
≥ 2, n
Útmutatás. Keressük a partikuláris megoldást C 1 n2
1.1-5.? 1.1-6.?
és
x1
= 0.
+ C2 alakban.
Bizonyítsuk be az 1.2. tételt. Bizonyítsuk be az 1.3. tételt.
1.2. Generátorfüggvények és rekurzív egyenletek A generátorfüggvényeket, többek között, felhasználhatjuk rekurzív egyenletek megoldására, bizonyos objektumok (pl. bináris fák) megszámolására, azonosságok bizonyítására, partíciós problémák megoldására. Az objektumok megszámolása rekurzív egyenletek felállításával és megoldásával történik. Ezek a rekurzív egyenletek általában nem lineárisak, megoldásukban segíthetnek a generátorfüggvények.
1.2.1. Értelmezés és m¶veletek Egy (an )n≥0
= ha0 , a1 , a2 , . . . , an , . . .i végtelen számsorozathoz hozzárendelhetünk egy hat-
ványsort a következoképpen: A(z)
= a0 + a1 z + a2 z2 + · · · + an zn + · · · =
X
n
an z
,
n≥0
amelyet az (an )n≥0 számsorozat generátorfüggvényének nevezünk. Például a Fibonacci-számok esetében a generátorfüggvény a következo: F(z)
=
X
Fn z
n
= z + z2 + 2z3 + 3z4 + 5z5 + 8z6 + 13z7 + · · · .
n≥0 2
Ha mindkét oldalt megszorozzuk z-vel, majd z -tel, a következoket kapjuk: F(z) zF(z) 2
z F(z)
= = =
F0
+ F1 z + F2 z2 + F3 z3 + · · · + Fn zn + · · · , 2 3 n F 0 z + F 1 z + F 2 z + · · · + F n−1 z + · · · , F0 z
2
+ F1 z3 + · · · + Fn−2 zn + · · · .
képletbol a másodikat, majd a harmadikat, és gyelembe Ha kivonjuk tagonként az elso
23
1.2. Generátorfüggvények és rekurzív egyenletek
kapjuk: vesszük a Fibonacci-számokat deniáló képletet, a következot F(z)(1
− z − z2 ) = z ,
ahonnan F(z)
z
=
1
.
− z − z2
(1.9)
A fenti számítások helyességét matematikailag igazolni lehet, de nem térünk ki erre. A generátorfüggvények segítségével, formális muveletek során kapott eredményeket a legtöbb esetben más módszerekkel is lehet igazolni. Tekintsük az A(z)
=
X
n
an z és B(z)
=
X
n≥0
n
bn z n≥0
generátorfüggvényeket. Az A(z) és B(z) generátorfüggvényeket akkor és csakis akkor mondjuk egyenlonek, ha an
= bn
bármely n természetes számra.
generátorfüggvényekkel végezheto muveleteket Ezután a következo, deniáljuk: összeadás és valós számmal való szorzás, eltolás, szorzás, deriválás, integrálás. Összeadás és valós számmal való szorzás
αA(z) + β B(z) =
X
(αan
+ βbn )zn .
n≥0
Eltolás A k
z A(z)
=
X
n+k
an z n≥0
X
n
an−k z n≥k
< 0, 0, . . . , 0, a0 , a1 , . . . > | {z }
generátorfüggvény a
=
számsorozatot jelképezi, míg az
k
1 z
k
(A(z)
− a0 − a1 z − a2 z2 − · · · − ak−1 zk−1 ) =
X
n−k
an z
< ak , ak+1 , ak+2 , . . . >
1.7. példa. Legyen A(z)
= 1 + z + z2 + · · · . Ekkor 1 A(z) − 1 = A(z) z
X
n
ak+n z n≥0
n≥k
generátorfüggvény az
=
sorozatot.
és
A(z)
=
1 1
−z
.
Szorzás Ha A(z) és B(z) generátorfüggvények, akkor A(z)B(z)
= = =
+ a1 z + · · · + an zn + · · · )(b0 + b1 z + · · · + bn zn + · · · ) 2 a0 b0 + (a0 b1 + a1 b0 )z + (a0 b2 + a1 b1 + a2 b0 )z + · · · X
(a0
n
sn z n≥0
,
24
1. Rekurzív egyenletek
ahol sn
=
n X
ak bn−k .
k=0
Sajátos eset. Ha bn
= 1 bármely n természetes számra, akkor n X X 1 = A(z) ak zn . 1−z n≥0 k =0
(1.10)
= 1 is igaz bármely n természetes számra, akkor
Ha még ezenkívül an
1
− z)
(1
X
=
2
(n
+ 1)zn .
(1.11)
n≥0
Deriválás
0
A (z)
X
= a1 + 2a2 z + 3a3 z2 + · · · =
(n
+ 1)an+1 zn .
n≥0
1.8. példa. Az A(z)
X
=
z
=
n
n≥0
1 1
−z
generátorfüggvény mindkét oldalát deriválva azt kapjuk, hogy
0 A (z)
X
=
nz
n−1
=
n≥1
1 (1
− z)2
.
Integrálás
Z
z
A(t)dt
= a0 z +
0
1 2
2
+
a1 z
1 3
a2 z
3
+ ··· =
X1 n≥1
n
an−1 z
n
1.9. példa. Legyen 1 1
−z
= 1 + z + z2 + z3 + · · ·
Mindkét oldalát integrálva azt kapjuk, hogy
ln
1 1
=z+
−z
1 2
2
z
+
1 3
3
z
+ ··· =
X n≥1
1 n
z
n
.
Ha a két fenti generátorfüggvényt összeszorozzuk, akkor 1 1
ahol Hn
=1+
1 2
+
1 3
+ ··· +
1 n
(H0
−z
= 0,
ln
1 1
H1
−z
=
X Hn z
n
,
n≥1
= 1) az ún. harmonikus számok.
.
25
1.2. Generátorfüggvények és rekurzív egyenletek
Argumentum cseréje Legyen A(z)
P
n
P
=
< a0 , a1 , a2 , . . . > sorozatot jelképezi, akkor A(cz) = is: < a0 , ca1 , c2 a2 , . . . cn an , . . . > sorozatot. Igazak még a következok n
an z , amely az
n≥0
n
n≥0 c an z pedig az
1 2 1 2
A(z)
A(z)
− A(−z) = a1 z + a3 z3 + · · · + a2n−1 z2n−1 + · · · . 1
= 1 + z + z2 + z3 + · · · =
1.10. példa. Legyen A(z)
1
+ A(−z) = a0 + a2 z2 + · · · + a2n z2n + · · · ,
1
+ z + z + ··· = 2
4
2
A(z)
1
. Ekkor
−z
+ A(−z) =
1
1
2
1
−z
!
1
+
1
=
+z
1 1
− z2
1
− z2
,
2
amely megkapható úgyis, hogy z-t z -tel helyettesítjük A(z)-ben. u Hasonlóképpen, megkaphatjuk a páratlan kitevoj tagok összegét:
z
1
+ z3 + z5 + · · · =
2
A(z)
− A(−z) =
1
1
2
1
−z
!
1
−
1
+z
=
z
.
A generátorfüggvények segítségével érdekes képleteket kaphatunk. Legyen például A(z)
=
1/(1
−
z)
=
1
+
z
+
2
z
+
z
3
+ ···.
+
Ekkor zA z(1
z)
=
F(z), vagyis éppen a
Fibonacci-számok generátorfüggvénye. A fenti képletbol zA z(1 Az
n+1
n+1
z
+ z) = z + z2 (1 + z) + z3 (1 + z)2 + z4 (1 + z)3 + · · · . + 1)-edik Fibonacci-szám, míg a
együtthatója a bal oldalon éppen F n+1 , vagyis az (n
jobb oldali együtthatója, a binomiális képlet alkalmazása után minden tagban
X
−k
n
k
k ≥0
Innen F n+1
=
X
n
−k k
k ≥0
!
! .
b n+2 1 c
=
X
n
−k k
k=0
! .
(1.12)
Emlékeztetünk, hogy a binomiális képlet általánosítható tetszoleges valós r-re is, vagyis
(1
r
+ z) =
X n≥0
!
r n
n
z
,
amely a binomiális együtthatók generátorfüggvénye. Itt
r n
! a kombináció általánosítása va-
lós r-re, vagyis
r
!
n
=
r(r 1, 0,
− 1)(r − 2) . . . (r − n + 1) , n(n − 1) . . . 1
ha n
>0,
ha n
=0, b(n + n−1
1)/2c. Egyszeru okoskodással ki
tetszoleges n
2
≥
1 természetes számra.
o feladatoknál, itt is a bal és jobb 1 konvenció alapján. Akárcsak az eloz
oldali részfákat vizsgáljuk meg. Ha a bal oldali részfában i csúcs és j levél van, akkor a jobb oldaliban n
( j)
− i − 1 csúcs és k −
(k− j)
j levél van. A bi b
n−i−1
szorzat éppen ezeknek a fáknak a
rekurzív képletet kapjuk: száma. Összegezve k és j szerint, a következo
(k)
bn
= 2b(k) + n−1
n−2 X k −1 X
( j)
bi b i=1
(k− j) n−i−1
.
(1.18)
j=1
generátorfüggvényt: Ennek a rekurzív egyenletnek a megoldására használjuk a következo (k)
B
(z)
=
X
(k) n
bn z n≥0
,
ahol k
≥1.
31
1.2. Generátorfüggvények és rekurzív egyenletek
n
Az (1.18) egyenlet mindkét oldalát z -nel megszorozva, majd összeadva az n
=
0, 1,
kapjuk: 2, . . . értékekre, a következot
X
(k) n bn z
=2
n≥1
X
(k)
b
n−1
n−2 k−1 X X X ( j) (k − j) zn . + bi b n−i−1
n
z
n≥1
n≥1
i=1
j=1
Az összegezés sorrendjét felcserélve
X
(k) n bn z
=2
n≥1
X
(k)
b
n−1
n−2 k −1 X X X ( j) (k− j) bi bn−i−1 zn . +
n
z
n≥1
j=1 n≥1
k−1 X ( j) (k − j) (z) + z B (z)B (z)
Innen (k)
B
(z)
i=1
(k)
= 2zB
j=1
vagy (k)
B
k−1 X ( j) (k − j) . B (z)B (z) (z) = 1 − 2z z
(1.19)
j=1
lépésre haladva, felírhatjuk a következoket. Lépésrol (2)
B
z
=
(z)
1
(1)
B
− 2z
2
(3)
B
(z)
=
(z)
=
2z
− 2z)
(1
5z
− 2z)
(1
(1)
(z)
(1)
(z)
B
2
3
(4)
B
2
(z)
B
3
,
3 4
, .
alakban keresni: Az általános megoldást megpróbáljuk a következo
k−1
(k)
B ahol, amint láttuk, c2
(z)
ck z
=
(1
k−1
− 2z)
(1)
B
(z)
k
,
= 1, c3 = 2, c4 = 5. Az (1.19) képletbe behelyettesítve, a ck
számokra
egy rekurzív összefüggést kapunk:
ck
=
k −1 X
ci ck−i
.
i=1
Ezt szintén a generátorfüggvények segítségével oldjuk meg. Ha k innen c1
=
1. Legyen c0
=
1. Ha C(z)
=
P
n≥0
n
cn z
=
2, akkor c2
gyelembe véve a generátorfüggvények szorzási képletét C(z)
− 1 − z = (C(z) − 1)2
2
vagy
C (z)
amelyet C(z)-re nézve megoldunk, és a
C(z)
=
3
−
√
1
2
=
c1 c1 , és
a cn számok generátorfüggvénye, akkor
− 4z
− 3C(z) + z + 2 = 0 ,
32
1. Rekurzív egyenletek
= 1 miatt csak a negatív elojel jó. Sorba fejtés után X −1 2n! 1 3 1 1/2 n − (1 − 4z) = − z 2 2 2 2n − 1 n n≥0 ! ! X X 1 2n n 1 2n n + z = 1+ z . 2(2n − 1) n 2(2n − 1) n n≥0 n≥1
képletet kapjuk, mivel C(0) 3
=
C(z)
2 3
=
2
! ,
Innen
(1)
Mivel bn
1
=
cn
2n
− 1)
2(2n
n
≥1.
n
(1) hogy B = 2n−1 , ha n ≥ 1, könnyen ellenorizhet o, = z/(1 − 2z). Tehát ! 2k−1 1 2k z (k) . B (z) = 2(2k − 1) k (1 − 2z)2k−1
Mivel azonban 1
=
− z)m
(1
X
!
+m−1
n
z
n
n≥0
n
,
eredményhez jutunk: a következo
(k)
B
(z)
1
=
2(2k
2k
− 1)
1
=
2(2k
k 2k
− 1)
!X
k
=
1 2k
−1
vagy (k) bn
=
1 2k n
!
k
!
k
!
−1 n − 2k + 1
−1 2k − 2 n
n−2k+1 n
2
z
.
! n−2k
2
!
n 2k
n 2k+n−1
2 z
n
n≥2k−1
2k
!
+n−2 n
0 ! n≥X
Innen pedig (k) bn
2k
−1
2
n−2k
.
1.2.3. A Z-transzformáció módszere Ha generátorfüggvényekkel oldunk meg egy inhomogén lineáris rekurzív egyenletet, akkor, amint láttuk, mindig egy racionális törtfüggvény sorba fejtése adja meg a megoldást. A Z-transzformáció módszerével ezt a sorba fejtést könnyebben elvégezhetjük. Legyen a raci onális törtfüggvény P(z)/ Q(z), ahol P(z) kisebb fokszámú, mint Q(z). Ha ismerjük a nevezo gyökeit, a törtfüggvényt elemi (vagy parciális) törtfüggvények összegére bonthatjuk a hatá rozatlan együtthatók módszerével. Nézzük meg eloször azt az esetet, amikor a nevezonek gyökei vannak, és legyenek ezek csak egyszeres (azaz egymástól különbözo) Ekkor felírhatjuk, hogy P(z) Q(z)
=
A1 z
− α1
+ ··· +
Ai z
− αi
+ ··· +
Ak z
− αk
.
α1 , α 2 , . . . , α k .
33
1.2. Generátorfüggvények és rekurzív egyenletek
Könnyen belátható, hogy
Ai
=
Másfelol
Ai z
ahol
lim (z
z→αi
− αi
− αi )
P(z) Q(z)
,
i
Ai
= −αi
−
1
1
αi
= 1, 2, . . . , k .
!= z
−Ai βi , 1 − βi z
kapjuk: βi = 1/αi . Ha most ezt az elemi törtet sorba fejtjük, akkor a következot
−Ai βi = − A i βi 1 − βi z n
Innen a z együtthatója
+ βi z + · · · + βni zn + · · · .
1
−Ai βni +1 , és jelöljük ezt Ci (n)-nel. Ekkor = −Ai βni +1 = −βi
C i (n)
lim (z
z→αi
vagy C i (n) Ha most elvégezzük a z
= −βni +1
(z
lim
− αi )
P(z) Q(z)
− αi )P(z)
z→αi
Q(z)
,
.
→ 1/z átalakítást, és gyelembe vesszük, hogy βi = 1/αi , akkor ! p(z) n−1 C i (n) = lim (z − βi )z , z→βi
ahol
q(z)
p(z)
=
q(z)
P(1/z) Q(1/z)
.
n
Ekkor az X(z) kifejtésében a z együtthatója éppen C 1 (n) Könnyen belátható, hogy ha
α
+ C2 (n) + · · · + Ck (n) . β =
gyöke a Q(z) polinomnak, akkor
1/α gyöke a q(z)
polinomnak. Például, ha z
P(z) Q(z)
=
2z (1
− z)(1 − 2z)
,
p(z)
akkor
Amennyiben egy gyök többszörös, például
βi
q(z)
=
2 (z
− 1)(z − 2)
részeredp-szeres, akkor a neki megfelelo
mény C i (n)
Itt
d
=
1 (p
lim
− 1)! z→β
i
d
.
p−1
dz p−1
(z
− βi )
p n−1
z
p(z) q(z)
! .
p
f (z) az f (z) függvény p-edrendu deriváltját jelenti. dz p algoritmusban összegezhetok. Az eddigiek a következo Feltesszük, hogy az egyenlet
együtthatóit a A, a megoldás állandóit pedig a C tömb tartalmazza.
34
1. Rekurzív egyenletek
L - ´ ´ (A, k, f ) 1
legyen az egyenlet a0 xn
+ a1 xn+1 + · · · + ak xn+k =
f (n);
n
szorozzuk be az egyenlet mindkét oldalát z -nel és összegezzünk n szerint 2
=
hozzuk az egyenletet X(z)
P(z)/ Q(z) alakra, ahol X(z)
=
P
n≥0
n
xn z
,
P(z) és Q(z) pedig polinomok 3
végezzük el a z
→ 1/z átalakítást, legyen az eredmény
p(z)/q(z), ahol p(z) és q(z) polinomok 4
legyenek q(z) gyökei:
β1 β2
p2 -szeres, p2
≥ 1, ≥ 1,
pk -szeres, pk
≥ 1;
p1 -szeres, p1
...
βk
ekkor az eredeti egyenlet általános megoldása
= C1 (n) + C2 (n) + · · · + Ck (n), ahol − d p n−1 C i (n) = 1/(( pi − 1)!) limz→β (z − βi ) z ( p(z)/q(z)) , − dz xn
pi
5
1
pi
i
i
i
1
= 1, 2, . . . , k .
return C A módszer neve onnan ered, hogy ha egy generátorfüggvényben z helyébe 1/z-t helyet-
tesítünk, akkor megkapjuk a Z-transzformáltját, amelyre hasonló muveletek léteznek, mint a generátorfüggvényekre, és amelyre alkalmazva a reziduum-tételt, a fenti eredményhez jutunk. 1.12. példa. Oldjuk meg az xn+1
− 2xn = 2n+1 − 2,
ha
n
≥ 0,
=0
x0
rekurzív egyenletet. n
z -nel beszorozva és összegezve
X xn+1 z
n
−2
n≥0
azaz
1 z
X(z)
X xn z
− 2X(z) =
2 1
− 2z
X(z)
=
n+1 n
2
n≥0
z
−
n≥0
−
2 1
−z
Innen
Az
X
=
n
2z
X 2z
n
,
n≥0
,
ahol X(z)
=
X xn z
n
.
n≥0
2
(1
− z)(1 − 2z)2
(z
− 1)(z − 2)2
.
→ 1/z helyettesítést elvégezve p(z) q(z)
=
2z
,
gyökei: 1 egyszeres, 2 kétszeres gyök. Ezért ahol a nevezo n
C1
C2
= lim z→2
d dz
2z z
= lim
n
−1
z→1
2z (z
− 2)2
! = 2 lim z→2
nz
=2
n−1
− 1) − zn = 2n (n − 2) . − 1)2
(z
(z
és
35
1.2. Generátorfüggvények és rekurzív egyenletek
Az általános megoldás tehát
= 2n (n − 2) + 2,
xn
n
≥0.
1.13. példa. Oldjuk meg az xn+2
= 2xn+1 − 2xn ,
ha
n
≥ 0,
x0
= 1,
=1
x1
rekurzív egyenletet. n
z -nel beszorozva és összegezve 1
X
z
n+2
xn+2 z
2
2
=
1 z
F(z)
2
xn+1 z
z
n≥0
innen
X
F(z)
1
−
z2
z
2 z
gyökei 1 A nevezo
=
z2
X xn z
n
,
n≥0
2
Ekkor F(1/z)
−2
n≥0
−z =
azaz
n+1
F(z)
− 2F(z) ,
! 1 +2 =− . z
−z . − 2z + 2
+ i és 1 − i. Kiszámítjuk C1 (n)-t és C2 (n)-t:
Mivel 1
+i=
C 1 (n)
=
C 2 (n)
=
√ 2 cos
π 4
lim
z→1+i
z
−zn+1 = − (1 − i)
i(1
+ i)n 2
és
−zn+1 −i(1 − i)n = . − (1 + i) 2 √ π π π , 1 − i = 2 cos − i sin ,
lim z→1−i z
+ i sin
4
4
4
hatványozás után (1
+ i)n =
√ n 2
cos
nπ 4
xn
+ i sin
nπ 4
,
(1
= C1 (n) + C2 (n) =
− i)n = √ n 2
√ n
sin
2
nπ 4
cos
nπ 4
− i sin
nπ 4
,
.
Gyakorlatok 1.2-1. Számítsuk ki, hány olyan n csúcsú bináris fa van, amelynek sem a bal, sem pedig a jobb oldali részfája nem üres. külön1.2-2. Számítsuk ki, hány olyan n csúcsú bináris fa van, amelyben minden levéltol csúcsnak pontosan két gyereke van. bözo 1.2-3. Oldjuk meg generátorfüggvény segítségével az alábbi rekurzív egyenletet. Hn
= 2Hn−1 + 1,
H0
=0.
(Hn itt a Hanoi-tornyai nevu feladat lépésszámát jelenti.)
36
1. Rekurzív egyenletek
1.2-4. Oldjuk meg Z-transzformáció segítségével az alábbi rekurzív egyenletet: F n+2
=
F n+1
+ Fn + 1,
ha n
≥ 0,
és
F0
= 0, F 1 = 1 .
egyenletrendszert: 1.2-5. Oldjuk meg a következo un vn ahol u0
= =
+ un−2 , + un−1 ,
vn−1 un
= 1, u1 = 2, v0 = 1.
1.3. Numerikus megoldás Leírunk egy függvényeljárást, amellyel lineáris rekurzív egyenleteket oldhatunk meg nume formában adjuk meg: rikusan. Az egyenletet a szokásos módon, a következo a0 xn
+ a1 xn+1 + · · · + ak xn+k =
f (n)
.
Az a0 , a1 , . . . , ak együtthatókat az A, míg az x0 , x1 , . . . , xk−1 kezdoértékeket az X vektor tartalmazza. Hogy kiszámítsuk xn értékét, sorra kiszámítjuk az xk , xk+1 , . . . , xn értékeket, k elemében (azaz a 0, 1, . . . , k minden alkalommal az X vektor elso
− 1 indexu elemekben)
o k értékét. orizve meg a sorozat eloz R´(A, X, k, n, f ) 1 for j 2 3 4 5 6 7 8 9
← k to n ← A[0] · X[0] for i ← 1 to k − 1 do v ← v + A[i] · X[i] v ← f ( j − k) − v /A[k] if j , n then for i ← 0 to k − 2 do X[i] ← X[i + 1] X[k − 1] ← v
do v
10 return v xj ( j A 25. sorokban kiszámítjuk a következo
o k érték = k, k + 1, . . . , n) értékét (az eloz
felhasználásával), ezt az értéket az algoritmusban v jelöli. A 79. sorokban, amennyiben k elemébe. A 10. még nem értük el az n-et, átmásoljuk az utolsó k értéket az X vektor elso sor visszaadja az xn értékét. Könnyen belátható, hogy az algoritmus futási ideje
Gyakorlatok
Θ(kn).
1.3-1. Hány összeadást, kivonást, szorzást, osztást és értékadást végez a R´ algorit adatokkal kiszámítja x1000 értékét? mus, ha az 1.4. példában szereplo
37
1. Feladatok
Feladatok 1-1. Homogén egyenlet megoldhatósága generátorfüggvénnyel Bizonyítsuk be, hogy tetszoleges homogén lineáris rekurzív egyenlet generátorfüggvénnyel olyan eset, hogy nem tudjuk alkalmazni a megvaló megoldáskor csak akkor fordulhat elo adott módszert, mivel az X(z)
=
0 egyenlethez jutunk, ha az egyenlet megoldása xn
=
0
minden n-re. 1-2. Komplex gyökök Z-transzformáláskor Vizsgáljuk meg, mi történik, ha a Z-transzformáció módszere alkalmazásakor a nevezo gyökei komplex számok. A rekurzív egyenlet megoldásának mindig valósnak kell lennie. Biztosítja-e ezt a módszer?
Megjegyzések a fejezethez Elaydi [119], Flajolet és Sedgewick [421], Greene és Knuth [175], valamint Mickens [327] könyve részletesen tárgyalja a rekurzív egyenletek megoldását. Vannak a generátorfüggvényekkel foglalkozó, magyar nyelvu könyvek is például Knuth [258], valamint Graham, Knuth és Patashnik [171]. Vilenkin muve [478] egyszeru módon tárgyal sok-sok feladatot a könyv utolsó két fejezete rekurzív egyenletekkel és generátorfüggvényekkel foglalkozik. Lovász [296] kombinatorikai problémákat és feladatokat tartalmazó könyvében is vannak generátorfüggvényekre vonatkozó feladatok. a levelek megszámolása a bináris A bináris fák megszámolása Knuth [258] könyvébol, fák halmazában, valamint az n csúcsú k levelu bináris fák megszámolása Kása Zoltán [243] valók. könyvébol
2. Komputeralgebra
A különféle matematikai számítások elvégzésére képes informatikai eszközök nélkülözhetetlenek a modern tudományban és ipari technológiában. Képesek vagyunk kiszámolni uveket, bolygók, csillagok pályáját, vezérelni atomerom egyenletekkel leírni, modellezni a természet számos törvényét. Ezek a számítások alapvetoen kétfélék lehetnek: numerikusak és szimbolikusak. Ámbár a numerikus számítások nemcsak elemi aritmetikai muveleteket foglalnak magukban, hanem olyan muveleteket is, mint matematikai függvények numerikus értékének, polinomok gyökeinek vagy mátrixok sajátértékének meghatározása, ezek a muveletek alap vetoen számokon értelmezettek, és ezek a számok a legtöbb esetben nem pontosak, pontos ságuk az adott számítógépes architektúra lebegopontos ábrázolási módjától függ. A szim szimbólumokon bolikus számításokat matematikai vagy informatikai objektumokat jelento értelmezzük. Ezek az objektumok lehetnek számok (egészek, racionális számok, valós és komplex számok, algebrai számok), de lehetnek polinomok, racionális és trigonometrikus függvények, egyenletek, egyenletrendszerek, algebrai struktúrák elemei, vagy éppen halmazok, listák, táblázatok. A szimbolikus számítások elvégzésére alkalmas számítógépes rendszereket (amelyek legtöbbször numerikus számításokra és az eredmények grakus megjelenítésére egyaránt képesek) komputeralgebra-rendszereknek vagy szimbolikus-algebrai rendszereknek nevezzük. Az utal.
algebra szó a szimbolikus objektumokkal végzett muveletek algebrai eredetére
A komputeralgebra-rendszerek mint számítógépes programok alapfeladata: (1) matematikai objektumok szimbolikus ábrázolása, (2) aritmetika ezekkel az objektumokkal. A hatékony komputeralgebra, mint tudományterület feladata pedig erre az aritmetikára épülo algoritmusok keresése, elemzése és megvalósítása tudományos kutatásokhoz és alkalmazásokhoz. Mivel a komputeralgebra-rendszerek szimbolikusan, (lényegében) tetszoleges pontos sággal és hibamentesen képesek számolni, eloször tisztázni kell, milyen adatszerkezeteket lehet hozzárendelni a különféle objektumokhoz. A 2.1. alfejezet a matematikai objektumok ábrázolásának problémakörét taglalja. A továbbiakban a szimbolikus algoritmusok közül folyamán a mindennapi tudomány és technika elengedismertetjük azokat, melyek az idok hetetlen részévé váltak. A természettudományok többsége jelenségeit, gondolatait matematikai egyenletekkel írja le. A lineáris egyenletek, egyenletrendszerek szimbolikus megoldásainak vizsgálata a jól ismert eliminációs módszereken alapul. A nemlineáris egyenletrendszerek megoldásai-
39
2.1. Adatábrázolás
nak megkeresésére eloször megvizsgáljuk az euklideszi algoritmus különféle változatait és a rezultánsmódszert. A hatvanas évek közepén Buchberger doktori dolgozatában egy hatékony módszert dolgozott ki többváltozós polinomegyenletek szimbolikus megoldásainak meghatározására, amit ma Gröbner-bázis elmélet néven ismerünk. Buchberger munkájára csak évekkel késobb kezdtek felgyelni, azóta a terület a komputeralgebra egyik legnépsze lesz szó a 2.2. és a 2.3. alfejezetekben. rubb ága. Ezekrol bemutatandó terület a szimbolikus integrálás. Habár a probléma formális A következo természete már több, mint 100 éve ismert (Liouville-elmélet), csak 1969-ben tudott Risch hatékonyR algoritmust adni annak eldöntésére, hogy ha adott egy valós elemi f függvény, akkor az
f (x)d x integrál is elemi-e és ha igen, az algoritmus meg is adja az integrál értékét.
A módszerrel a 2.4. alfejezetben foglalkozunk. A fejezet végén áttekintjük a szimbolikus algoritmusok elméleti és gyakorlati vonatkozásait (2.5. alfejezet), külön részt szánva napjaink komputeralgebra-rendszereinek.
2.1. Adatábrázolás Ahhoz, A komputeralgebrában a legkülönfélébb matematikai objektumok fordulnak elo. hogy ezekkel az objektumokkal számolni lehessen, ábrázolni és tárolni kell oket a számítógép memóriájában. Ez elméleti és gyakorlati problémák egész sorát veti fel. Ebben az a kérdésekrol lesz szó. alfejezetben ezekrol Tekintsük az egészeket. Egyrészt matematikai tanulmányainkból tudjuk, hogy halmazuk azzal is tisztában vagyunk, megszámlálható számosságú, viszont informatikai szemszögbol hogy számítógépünk csak véges sok egész tárolására képes. Az, hogy mekkora a legnagyobb egész, amit minden további erofeszítés nélkül ábrázolni tudunk, attól függ, hogy számítógépes architektúránkban mekkora a gépi szó mérete. Ez tipikusan 16, 32, 48 vagy 64 bit. Az egy gépi szóban ábrázolható egészeket egyszeres pontosságú egészeknek nevezzük. Nem biztos, hogy egy tetszoleges egész szám elfér egy gépi szóban, vagyis olyan adatstruktúrára van szükség, ami több gépi szó felhasználásával tetszolegesen nagy egész ábrázolására ké pes. Természetesen a tetszolegesen nagy nem jelent végtelen nagyot, hiszen valamilyen tervezési igény vagy a memória mérete mindenképpen korlátot szab. Emellett olyan adatáb rázolást kell megvalósítani, amelyre hatékony muveletek építhetok. Az egészek reprezentá ciójának alapvetoen két útja van:
•
helyiértékes (a hagyományos decimális számrendszerbeli ábrázolás általánosítása), amelyben egy n egészet
Pk−1 i= 0
i
di B alakban írunk fel, ahol a B alapszám akármilyen,
egynél nagyobb egész lehet. A hatékonyság növelése miatt B-t úgy érdemes választani, hogy B
{0 ≤
di
− 1 beleférjen egy gépi szóba. A di jegyek (0 ≤ i ≤ k − 1) vagy a kanonikus ≤ B − 1} vagy a szimmetrikus {−b B/2c < di ≤ b B/2c} jegyhalmazból való
egyszeres pontosságú egészek. Az így leírható többszörös pontosságú egészek lineáris listás [d0 , d1 , . . . , dk−1 ] ábrázolásának számítógépes megvalósítása történhet dinamiku san vagy statikusan, attól függoen, hogy a lineáris listát láncolt listaként vagy tömbként implementáljuk.
•
számú, egyszeres pontosságú, páronként moduláris, amelyben az n egész megfelelo relatív prím modulusokkal vett moduláris képeinek lineáris listájaként adható meg. A n a kínai maradéktétel segítségével rekonstruálható. moduláris képekbol
40
2. Komputeralgebra
A moduláris alak gyorsabb az összeadás, kivonás és szorzás muveleteket tekintve, de lényegesen lassabb például oszthatósági vizsgálatoknál (amelyek sok esetben elkerülhetetlenek). Nyilvánvaló, hogy az adatstruktúra megválasztása erosen befolyásolja algoritmusaink sebességét. 2.1. példa. Az alábbi példában az egyszeruség kedvéért természetes számokkal dolgozunk. Tegyük fel, hogy olyan számítógép architektúránk van, ahol a gépi szó 32 bites, vagyis számítógépünk az I1
=
[0, 2
32
− 1] =
[0, 4 294 967 295] intervallum egészeivel képes egész aritmetikát végezni. Erre
az aritmetikára építve az architektúránkon valósítsunk meg olyan egész aritmetikát, amellyel az I2 [0, 10
50
=
] intervallumban is számolni tudunk.
A helyiértékes ábrázoláshoz legyen B
= 104 , továbbá
n1
=
123456789098765432101234567890
n2
=
2110
,
.
Ekkor
=
n1
[7890, 3456, 1012, 5432, 9876, 7890, 3456, 12]
,
n2
=
[2110]
n1
+
n2
=
[0, 3457, 1012, 5432, 9876, 7890, 3456, 12]
,
n1
∗
n2
=
[7900, 3824, 6049, 1733, 9506, 9983, 3824, 6049, 2]
, ,
ahol az összeadást és a szorzást helyiértékesen számoltuk. A moduláris ábrázoláshoz válasszunk páronként relatív prím számokat az I1 intervallumból úgy, hogy szorzatuk nagyobb legyen 10 m1 m4
Q6
mi i=1 tossal ábrázolunk. prímek, ahol
>
50
-nél. Legyenek például
= 4294967291,
10
50
= 4294967279,
m2
= 4294967197,
m5
= 4294967189,
m3 m6
= 4294967231 , = 4294967161
. Egy I2 intervallumbeli egészet tehát az I1 intervallumból vett számha-
Ekkor
valamint n2
n1
≡ 2009436698
(mod m1 ),
n1
≡ 961831343
n1
≡ 4253639097
(mod m3 ),
n1
≡ 1549708
n1
≡ 2459482973
(mod m5 ),
n1
≡ 3373507250
≡ 2110
(mod mi ), (1
(mod m2 )
(mod m4 )
,
,
(mod m6 )
,
≤ i ≤ 6), vagyis
n1
+
n2
=
[2009438808, 961833453, 4253641207, 1551818, 2459485083, 3373509360]
,
n1
∗
n2
=
[778716563, 2239578042, 2991949111, 3269883880, 1188708718, 1339711723]
,
ahol az összeadás és a szorzás koordinátánként modulárisan elvégezve értendo.
Általánosabban, a matematikai objektumok ábrázolásának három absztrakciós szintjét érdemes megkülönböztetni: 1.
Az objektumok szintje. Ezen a szinten az objektumok formális matematikai objektumok nak tekinthetok. Például 2 + 2, 3 ∗ 3 − 5 és 4 ugyanazt az objektumot jelölik. Hasonlóan, az (x
+
2
1) (x
tekinthetok.
−
1) és x
3
+
x
2
−
x
−
1 polinomok az objektumok szintjén azonosnak
41
2.1. Adatábrázolás
ábrázolásait. Például A forma szintje. Itt már megkülönböztetjük az objektumok eltéro
2.
+ 1)2 (x − 1) és
az (x
x
3
+ x2 − x − 1 polinomok ugyanannak a polinomnak különbözo
reprezentációi, hiszen az elobbi egy szorzat, utóbbi egy összeg. ábrázolásokat tekintjük Az adatstruktúra szintje. Itt a számítógép memóriájában eltéro
3.
különbözoknek. Az x
3
+ x2 − x − 1 polinomnak ezen a szinten többféle reprezentációja
is lehet, a polinomot leírhatja például
• •
egy együtthatókból álló tömb: [−1, −1, 1, 1] , egy láncolt lista: [−1, 0]
→ [−1, 1] → [1, 2] → [1, 3]
.
matematikai objektumok számítógépes ábrázolásához a komputeralgebraA különbözo rendszerek tervezoinek dönteniük kell mind a forma, mind az adatstruktúra szintjén. A döntést olyan kérdések nehezítik, mint a reprezentáció memóriaigénye, olvashatósága, vagy az ábrázolás számítási ideje. Például az
− 1)2 (x + 1)3 (2x + 3)4 9 8 7 6 5 4 3 2 16x − 80x + 88x + 160x − 359x + x + 390x − 162x − 135x + 81
= =
f (x)
(x
polinom szorzat alakja kifejezobb, mint az összeg alakja, de utóbbi elonyösebb, ha mond5
juk az x -es tag együtthatójára vagyunk kíváncsiak. A forma szintjére vonatkozó döntési nehézségeket szemlélteti az alábbi példa:
•
x
•
1000
(x
− 1 és (x − 1)(x999 + x998 + · · · + x + 1)
+ 1)
1000
és x
1000
+ 1000x
999
,
+ · · · + 1000x + 1
.
ábrázolására tökéletes módszert A matematikai objektumok minden igényt kielégíto reprezentációi is megengedetnem ismerünk. A gyakorlatban az objektumoknak különbözo ábrázolása esetén meg kell tek. Ez azt a problémát veti fel, hogy ugyanazon objektum eltéro tudnunk állapítani azok egyenloségét, konvertálni kell tudnunk egyik alakból a másikba és az egyértelmu ábrázoláshoz egyszerusítéseket kell tudnunk azokon végrehajtani. A forma szintjén például minden egész számot felírhatunk valamely B alapú számrendszerben, míg az adatstruktúra szintjén a forma szintjén kapott lineáris listát láncolt listaként vagy tömbként reprezentálhatjuk. ol állnak. Memória A racionális számok egészek párjaiból, a számlálóból és a nevezob takarékosság érdekében, valamint két racionális szám könnyu összehasonlíthatósága miatt legnagyobb közös osztójával egyszerusített célszeru a számláló és a nevezo alakot ábrázolni. Mivel az egészek euklideszi gyur ut alkotnak, a legnagyobb közös osztó euklideszi algorit érdemes pozitívnak mussal gyorsan számolható. Az ábrázolás egyértelmuségéhez a nevezot választani, a racionális szám elojele így a számláló elojele lesz. A többváltozós polinomok (az R[x1 , x2 , . . . , xn ] n-változós polinomgyur u elemei, ahol R gyur u) a1 x x
ei
1
1.
1
x
ei
2
2
e1
ein
. . . xn
+ a2 xe + · · · + an xe 2
n
alakúak, ahol ai
∈ R \ {0}, ei = (ei , . . . , ei 1
e
n
) és x i -t írtunk
helyett. A forma szintjén az alábbi reprezentációs lehetoségek adódnak.
Kiterjesztett vagy faktorizált ábrázolás, ahol a polinom összegként vagy szorzatként jelenik meg:
• •
− x2 + y − 1 , 2 x + 1 (y − 1) .
x
2
y
42 2.
2. Komputeralgebra
Rekurzív vagy disztributív ábrázolás (csak többváltozós esetben). Például kétváltozós R[x, y]-belinek, (R[x])[y]-belinek vagy (R[y])[x]polinomgyur uben f (x, y) tekintheto belinek:
• • •
+ x2 + xy2 − 1 , 2 2 (x + x)y + x − 1 , 2 2 2 (y + 1)x + y x − 1 . 2
2
x y 2
−1 + 0x + 0x + 0x − 1. A gyakorlatban a többváltozós polinomok
Az adatstruktúra szintjén ritka vagy teljes reprezentáció lehetséges, például a ritka x polinom teljes ábrázolása x
4
3
4
2
ritka ábrázolása a célravezeto. A
P∞
i=0
i
ai x alakú hatványsorok legegyszerubb ábrázolása az, ha valamilyen véges ren-
dig adjuk csak meg az együtthatók sorozatát, így lényegében egyváltozós polinomoknak hatványsorokhoz tekintjük oket. Ezzel a megközelítéssel az a probléma, hogy különbözo a hatványsort az együtthatói sorozatát tartozhat ugyanaz a reprezentáció. Ezt elkerülendo, generáló függvénnyel szokás leírni. A generáló függvény egy olyan kiszámítható f függvény, amire f (i)
azt ismerni, = ai . A hatványsorokkal végzett muveletekhez ekkor elegendo
hogy hogyan kell az operandusok együtthatóiból eloállítani a muvelet eredményét repre h hatványsor zentáló sorozat együtthatóit. Például az f és g hatványsorok szorzatát jelölo együtthatóit a hi
=
Pi
k=0
fk gi−k függvény segítségével származtathatjuk. Ekkor a hi együtt-
hatókat csak akkor kell ténylegesen kiszámolni, ha szükség van az értékükre. Ezt a komputeralgebrában is gyakran használt technikát késleltetett kiértékelésnek nevezzük. Mivel a komputeralgebra-rendszerek szimbolikusan számolnak, az algoritmusok muve letigényének vizsgálatán kívül mindig szükség van memóriaigényük vizsgálatára is, hiszen 1
a memóriaigény befolyásolja a tényleges futási idot. Tekintsünk egyszeru példaként egy n álló lineáris egyenletrendszert, ahol minden egyes egész együttismeretlenes, n egyenletbol ható elfér a számítógép
ω
hosszúságú rekeszében. Kizárólag egész aritmetikát és Gaussn−1
eliminációt alkalmazva a redukció eredményeként kapott együtthatók egyenként 2
ω tár-
helyet igényelhetnek. Ha az együtthatók polinomok lennének és polinomaritmetikát használnánk, az eredmény polinomok együtthatóinak mérete, csakúgy mint a fokszámuk, exponenciális növekedést mutatna. A meggyelt exponenciális növekedés ellenére a kapott végeredmény mégis
normális méretu, hiszen a Cramer-szabály miatt a megoldások de terminánsok hányadosaiként is megkaphatók, amelyek pedig közelítoleg csak nω tárhelyet igényelnek. Ezt a jelenséget nevezzük köztes számítási tárrobbanásnak. Elofordulása gyakori a komputeralgebra algoritmusokban. 2.2. példa. Egész aritmetikát használva oldjuk meg az alábbi lineáris egyenletrendszert. 37x
+ 22y + 22z
=
1
31x
− 14y − 25z
=
97
,
−11x + 13y + 15z
=
−86 .
,
sort 31-gyel, a másodiEloször a második egyenlet x változóját elimináljuk. Szorozzuk meg az elso kat
1
−37-tel és adjuk össze oket. Ha ezt a módszert alkalmazzuk a harmadik egyenlet
x változójának
mi a RAM-modellnek megfeleloen A futási idot muveletszámban mérjük. Ha Turing-gép modellt és konstans
hosszú gépi szavakat használnánk, akkor ilyen probléma nem merül fel, mert a tár mindig alsó korlátja az idonek.
43
2.1. Adatábrázolás
moduláris
R-beli feladat
-
R/hmi-beli feladat
redukció
közvetlen számítások moduláris számítások
?
?
R-beli
R/hmi-beli
megoldás
megoldás
rekonstrukció
2.1. ábra. A moduláris algoritmusok általános sémája.
eliminációjára, az eredmény az alábbi lesz: 37x
+ 22y + 22z
1200y
=
1
,
+ 1607z
=
−3558 ,
+ 797z
=
−3171 .
723y
Most y eliminálásához a második sort 723-mal, a harmadikat
−1200-zal szorozzuk, majd összeadjuk
oket. Az eredmény: 37x
+ 22y + 22z
1200y
=
1
,
+ 1607z
=
−3558 ,
205461z
=
1232766
.
Tovább folytatva az eljárást és sorban eliminálva a változókat végül azt kapjuk, hogy
Egyszerusítés után x
1874311479932400x
=
5622934439797200
246553200y
=
−2712085200 ,
205461z
=
1232766
,
.
= 3, y = −11, z = 6 adódik. Természetesen, ha a számítások közben a legnagyobb
közös osztókkal egyszerusítünk, az együtthatók nagysága kevésbé drasztikusan no.
A számítási tárrobbanás elkerülésére moduláris módszerek használatosak: ahelyett, hogy a számításainkat az R struktúra (pl. euklideszi gyur u) egészeivel végeznénk, valamely faktorstruktúrában dolgozunk, majd az eredményt
visszatranszformáljuk R-be (2.1. ábra). A moduláris redukció és a moduláris számítások általában hatékonyan elvégezhetok, a rekonstrukciós lépés pedig valamilyen interpolációs stratégiával történhet. Megjegyezzük, hogy a moduláris algoritmusok nagyon gyakoriak a komputeralgebrában, de nem univerzálisak.
44
2. Komputeralgebra
2.2. Polinomok közös gyökei Legyen R egy integritási tartomány, továbbá legyenek
+ f1 x + · · · + fm−1 xm−1 + fm xm ∈ R[x], fm , 0 , n−1 g0 + g1 x + · · · + gn−1 x + gn xn ∈ R[x], gn , 0
= =
f (x) g(x)
f0
tetszoleges polinomok, n, m
(2.1) (2.2)
∈ N, n + m > 0. Állapítsuk meg, hogy mi annak a szükséges és
elégséges feltétele, hogy a két polinomnak legyen közös gyöke R-ben.
2.2.1. Klasszikus és b®vített euklideszi algoritmus Ha T test, akkor T [x] euklideszi gyur u. Emlékeztetoül, az R integritási tartományt euklideszi gyur unek nevezzük a
ϕ
\ {0} → N euklideszi függvénnyel, ha bármely a, b ∈ R (b , 0) ∈ R, hogy a = qb + r, ahol r = 0 vagy ϕ(r) < ϕ(b), továbbá minden ϕ(ab) ≥ ϕ(a). A q = a quo b elemet hányadosnak, az r = a rem b : R
esetén létezik olyan q, r a, b
∈
R
\ {0}
esetén
elemet maradéknak nevezzük. Ha egy R euklideszi gyur uben dolgozunk, azt szeretnénk, ha a legnagyobb közös osztó egyértelmuen meghatározható lenne. Ehhez az R gyur u egység egyetlen elem kivászorzók által meghatározott ekvivalencia-osztályainak mindegyikébol lasztása szükséges. (Például az egészek {0}, {−1, 1}, {−2, 2}, . . . osztályaiból mindig a nemnegatívat választjuk.) Így minden a a
∈ R egyértelmuen írható fel = unit(a) · normal(a)
alakban, ahol normal(a)-t az a elem normálalakjának nevezzük. Tekintsünk egy T test feletti R
=
∈ R elem normálalakja legyen a megfelelo = a/ lc(a), ahol lc(a) jelenti az a polinom foegyüttha-
T [x] euklideszi gyur ut. Ekkor az a
normált fopolinom, vagyis normal(a)
tóját. Foglaljuk össze a lényegesebb eseteket:
• •
ha R
= Z, akkor unit(a) =
ha R
=
sgn(a) (a
, 0) és ϕ(a) = normal(a) = | a |,
= lc(a) (az a polinom foegyütthatója a unit(0) = = a/ lc(a) és ϕ(a) = deg a.
T [x] (T test), akkor unit(a)
megállapodással), normal(a)
1
Az alábbi algoritmus tetszoleges euklideszi gyur uben kiszámítja két elem legnagyobb közös osztóját. Megjegyezzük, hogy a világ egyik legosibb algoritmusáról van szó, amit Euklidész már i. e. 300 körül ismert. K-E(a, b)
6
← normal(a) ← normal(b) while d , 0 do r ← c c ← d d ← r
7
return normal(c)
1
c
2
d
3 4 5
rem d
Az egészek gyur ujében a 4. sor maradék képzése c −bc/d c-t jelenti. Ha R
= T [x], ahol T
test,
akkor a 4. sor maradék képzése az E ´ --´ - ´ ´ (c, d)
45
2.2. Polinomok közös gyökei
iteráció
r
c
d
18
30
1
18
30
18
2
12
18
12
3
6
12
6
4
0
6
0
(a) K-E(−18, 30) muködése.
iteráció
r
1
x
+
− 23 x+ 4
23
4x
2 3
2
−
c x
38 3
20 3
0 4
−
17 3 3
x
6
(b) K-E(12x
4
3
+
−
20
x
13 3 2
d x
2
−
23 3
x
+
+ 7x − 2 3 38 20 2 4x − x+ 3 3 23 23 − 4 x+ 6 x
14 3
x
3
−
+ 7x − 2 20 x+ 3 3 23 23 − 4 x+ 6
4x
20
2
3
x
−
2
38
0
− 68x3 + 52x2 − 92x + 56, −12x3 + 80x2 − 84x + 24) muködése.
2.2. ábra. A K-E algoritmus muködésének bemutatása adatok a bemeno
Z-ben és Q[x]-ben. Az (a) esetben a = −18, b = 30, a, b ∈ Z. A pszeudokód elso két sora a bemeno számok abszolút értékét számolja
iterációkban számolt r, c és d ki. A harmadik sortól az hatodik sorig tartó ciklus négyszer fut le, a különbözo értékeket mutatja a táblázat. A K-E(−18,30) algoritmus eredményül a 6-ot szolgáltatja. A (b) paraméterek a esetben a bemeno
=
12x
4
− 68x3 + 52x2 − 92x + 56, b = −12x3 + 80x2 − 84x + 24 ∈ Q[x].
A
két sora a polinomok normálalakját eredményezi, majd a while ciklus háromszor fut le. Az algoritmus program elso kimenete a normal(c)
= x − 2/3 polinom.
algoritmussal számolható, melynek elemzését az 2.2-1. gyakorlatra hagyjuk. A 2.2. ábra a K-E muködését mutatja
Z-ben és Q[x]-ben. Megjegyezzük, hogy Z-ben a
program a while ciklusba mindig nemnegatív számokkal lép be, a maradék képzés mindig nemnegatív számot eredményez, így a 7. sorban a normalizálás felesleges. annak egy bovített A K-E algoritmus futási idejének vizsgálata elott változatával foglalkozunk. B ´-E(a, b) 1
(r0 , u0 , v0 )
2
(r1 , u1 , v1 )
3
while r1
4
,0 ← r0 quo r1 r ← r0 − qr1 u ← (u0 − qu1 ) v ← (v0 − qv1 ) (r0 , u0 , v0 ) ← (r1 , u1 , v1 ) (r1 , u1 , v1 ) ← (r, u, v) normal(r0 ), u0 /(unit(a) · unit(r0 )),
do q
5 6 7 8 9 10
← (normal(a), 1, 0) ← (normal(b), 0, 1)
return
Ismert, hogy az R euklideszi gyur uben az a, b mas u, v
∈
· unit(r0 ))
∈ R elemek legnagyobb közös osztója alkal= au + bv alakban. De nem csak egy ilyen megfelelok, akkor u1 = u0 + bt és v1 = v0 − at is azok
lnko(a, b) R elemekkel kifejezheto
számpár létezik. Ha ugyanis u0 , v0
v0 /(unit(b)
46
2. Komputeralgebra
minden t
∈ R esetén: au1
+ bv1 = a(u0 + bt) + b(v0 − at) = au0 + bv0 = lnko(a, b) .
A K-E algoritmust úgy egészítettük ki, hogy eredményül ne csak a legna gyobb közös osztót szolgáltassa, hanem az iméntieknek megfeleloen egy konkrét u, v
∈
R
számpárt is megadjon. Legyen a, b
∈
ϕ
R, ahol R euklideszi gyur u a
euklideszi függvénnyel. A B ´-
két sora kezdeti értékadásainak megfeleloen E pszeudokód elso az
= u0 a + v0 b
r0
és
= u1 a + v1 b
r1
(2.3)
egyenletek nyilván teljesülnek. Megmutatjuk, hogy a (2.3) egyenloségek a pszeudokód while ciklusának transzformációira invariánsak. Tegyük fel, hogy a ciklus valamely ite a (2.3) feltételek teljesülnek. Ekkor a pszeudokód 45. sora rációjának végrehajtása elott szerint r
= r0 − qr1 = u0 a + v0 b − q(au1 + bv1 ) = a(u0 − qu1 ) + b(v0 − qv1 ) ,
a 67. sorok miatt amibol
= a(u0 − qu1 ) + b(v0 − qv1 ) = au + bv.
r
A 89. sorok olyan értékadásokat jelentenek, melyben u0 , v0 felveszi u1 és v1 , majd u1 , v1 a felveszi u és v értékeit, továbbá r0 , r1 felveszi r1 és r értékét. Ezért (2.3) egyenloségei while ciklus kiértékelése után is teljesülnek. Mivel a ciklus újabb és újabb végrehajtásakor
ϕ(r1 ) < ϕ(r0 ),
így a 89. sorok értékadásai során keletkezett
{ϕ(ri )}
sorozat a természetes
sorozatát alkotja, ezért a vezérlés elobb számok szigorúan monoton csökkeno utóbb kilép a while ciklusból. A legnagyobb közös osztó az algoritmus maradékos osztás sorozatának utolsó nem nulla maradéka, a 89. soroknak megfeleloen r0 . 2.3. példa. Vizsgáljuk meg a B ´-E algoritmus maradéksorozatát az a(x)
=
63x
+ 57x4 − 59x3 + 45x2 − 8 ,
b(x)
=
−77x + 66x + 54x − 5x + 99
5
4
3
(2.4)
2
(2.5)
polinomok esetében:
r0
=
r1
=
r2
=
r3
=
r4
=
r5
=
x x
5
4
+ −
19 21 6 7
6185 4851
x
x 3
x 3
4
−
77
x
539
420796475
x
2
3
+
+
+
2
1016
771300096
−
x
63
54
−
+
59
x
2
5 7 5
77
+
x
2
x
−
−
1894 1617
8 63
9 7 x
224465568 420796475
125209969836038125 113868312759339264
x
−
,
, + x
943
,
441
+
100658427 38254225
,
3541728593586625 101216278008301568
471758016363569992743605121 180322986033315115805436875
.
,
47
2.2. Polinomok közös gyökei
az u0 , v0 változók értékei: Az pszeudokód 10. sorának végrehajtása elott
u0
113868312759339264
=
125209969836038125
− v0
=
− + −
x
3
66263905285897833785656224
−
81964993651506870820653125
1722144452624036901282056661
x
901614930166575579027184375 113868312759339264 125209969836038125
x
−
4
+
x
2
1451757987487069224981678954 901614930166575579027184375
65069381608111838878813536 81964993651506870820653125
178270505434627626751446079 81964993651506870820653125 179818001183413133012445617 81964993651506870820653125
x
2
+
x
,
3
6380859223051295426146353 81964993651506870820653125
x
.
A visszatérési értékek:
lnko(a, b)
=
u
=
1, 2580775248128 467729710968369
− v
=
3
27102209423483 2338648554841845 703847794944
155909903656123
−
x
x
4
25249752472633 2338648554841845
3823697946464
−
779549518280615
+
x
+ x
2
x
2
7615669511954 779549518280615 3072083769824
779549518280615
−
x
,
3
301255883677 779549518280615
x
+
25468935587159 2338648554841845
.
Láthatjuk, hogy az együtthatók drasztikus növekedést mutatnak. Felvetodik a kérdés: miért nem normalizálunk a while ciklus minden iterációjában? Ez az ötlet vezet el a polinomok euklideszi algoritmusa normalizált változatához. B ´-E- ´ (a, b) 1 2 3 4 5 6 7 8 9 10 11 12 13 14
← unit(a) ← (normal(a), e−0 1 , 0) e1 ← unit(b) −1 (r1 , u1 , v1 ) ← (normal(b), 0, e1 ) while r1 , 0 do q ← r0 quo r1 s ← r0 rem r1 e ← unit(s) r ← normal(s) u ← (u0 − qu1 )/e v ← (v0 − qv1 )/e (r0 , u0 , v0 ) ← (r1 , u1 , v1 ) (r1 , u1 , v1 ) ← (r, u, v) return r0 , u0 , v0 e0
(r0 , u0 , v0 )
48
2. Komputeralgebra
2.4. példa. Nézzük meg a B algoritmus során keletkezett maradékso ´-E- ´ rozatot és az e együtthatósorozatot a korábbi (2.4), (2.5) polinomokra: r0
=
x
5
r1
=
x
4
r2
=
x
3
r3
=
x
2
r4
=
x
r5
=
1,
19
+
21 6
−
7
4
3
−
9144
+
6185
x
59 63
54 77 2
x
8034376
5
+
x
3
2
+
7 5
77
5682
+
2338183
+
+
x
−
x
6185
x
+
166651173 5236962760
x
x
2
x
8
−
,
63
9
− ,
+
7
10373 6185
369080899 257100032
,
,
,
e0
=63 ,
e1
= − 77 ,
e2
=
e3
=
e4
=−
e5
=
A pszeudokód 14. sorának végrehajtásakor az lnko(a, b) lnko(a, b)
=
u
=
2580775248128 467729710968369
=
x
3
27102209423483 2338648554841845 703847794944
155909903656123
−
Q[x]-ben
4851
,
771300096 420796475
,
222685475860375 258204790837504
,
156579848512133360531 109703115798507270400
= r0 , u = u0 , v = v0
.
változók értékei:
1,
− v
6185
x
4
25249752472633 2338648554841845
3823697946464
−
779549518280615
+
x
+ x
2
7615669511954 779549518280615 3072083769824
779549518280615
2
x
−
x
,
3
301255883677 779549518280615
x
+
25468935587159 2338648554841845
.
az együtthatók nagyságát tekintve az euklideszi algoritmus normalizált változa-
de az együtthatók növekedését így sem kerültük el. A B tának elonye szembetun o, ´ leírásához, elemzéséhez beveE- algoritmus gépi architektúra függo ´ zetjük az alábbi jelölést. Legyen
λ(a) λ(a)
= blog2 |a|/wc + 1, = max{λ(b), λ(c)},
λ(a)
=
∈ Z \ {0}, és λ(0) = 0 , ha a = b/c ∈ Q, b, c ∈ Z, lnko(b, c) = 1 , X ha a
max{λ(b), λ(a0 ), . . . , λ(an )}, ha a
=
ai x
i
/b ∈ Q[x] ,
0≤i≤n
ai
∈ Z,
b
∈ N+ ,
lnko(b, a0 , . . . , an )
=1,
ahol w a számítógépes architektúra szóhossza bitekben. Könnyu meggondolni, hogy ha a, b
∈ Z[x] és c, d ∈ Q, akkor λ(c + d) λ(a + b) λ(cd), λ(c/d) λ(ab)
≤ λ(c) + λ(d) + 1 , ≤ max{λ(a), λ(b)} + 1 , ≤ λ(c) + λ(d) , ≤ λ(a) + λ(b) + λ(min{deg a, deg b} + 1) .
Az alábbi tételeket bizonyítás nélkül közöljük. 2.1. tétel. Ha a, b
∈ Z és λ(a) = m ≥ n = λ(b), akkor a K-E és a B ´-
E algoritmusok O(mn) gépi szóban mért elemi aritmetikai muveletet igényelnek.
49
2.2. Polinomok közös gyökei
2.2. tétel. Ha F test, a, b, ∈ F[x], deg(a)
= m ≥ n = deg(b), akkor a K-E,
a B algoritmusok O(mn) F-beli ´-E és a B ´-E- ´ elemi aritmetikai muveletet igényelnek. Vajon az együtthatók imént látott növekedése pusztán csak a példaválasztásból fakad? Vizsgáljunk meg a B algoritmusban egyetlen maradékos osztást. ´-E-N ´ Legyen a
= bq + e∗ r, ahol
a
b
r
= =
x
x
m
n
1
+
c 1
+
d
m−1 X
i
∈ Q[x] ,
i
∈ Q[x] ,
ai x i=0 n−1 X
bi x i=0
∗ + ∈ Q[x] fopolinomok, ai , bi ∈ Z, e ∈ Q, c, d ∈ N , és tekintsük az n = m − 1 esetet. Ekkor q
λ(q) ∗
e r
λ(e∗ r)
=
x
+
am−1 d
≤ λ(a) + =
a
− bn−1 c
cd λ(b) + 1
− qb =
acd
2
,
, − xbcd2 − (am−1 d − bn−1 c)bd
≤ λ(a) + 2λ(b) + 3 .
cd 2
, (2.6)
Vegyük észre, hogy a (2.6) becslés az r maradék polinom együtthatóira is érvényes, vagyis
λ(r) ≤ λ(a) + 2λ(b) + 3.
Így
λ(a) ∼ λ(b)
esetén maradékos osztásonként az együtthatók
mérete legfeljebb kb. háromszorosára nohet. Pszeudovéletlen polinomokra a becslés élesnek tunik, a kísérletezni vágyó Olvasónak ajánljuk a 2-1. feladatot. A legrosszabb esetre kapott becslés azt sejteti, hogy
λ(rl ) = O(3l · max{λ(a), λ(b)}), ahol l jelöli a B algoritmus futási idejét, vagyis lényegében ´-E-N ´ azt, hogy a while ciklus hányszor hajtódik végre. Szerencsére, ez az exponenciális növekedés nem teljesül az algoritmus minden iterációjában, végeredményben pedig az együtthatók növekedése a bemenet függvényében polinomiálisan korlátos. A késobbiekben látni fogjuk, hogy moduláris technika alkalmazásával az együtthatók növekedése teljesen elkerülheto. Összefoglalva, az euklideszi algoritmus segítségével az f , g
∈
R[x] (R test) polinomok
legnagyobb közös osztóját kiszámítva f -nek és g-nek pontosan akkor van közös gyöke, ha a legnagyobb közös osztójuk nem konstans. Ha ugyanis lnko( f , g)
= d ∈ R[x] nem konstans,
akkor d gyökei f -nek és g-nek is gyökei, hiszen d osztója f -nek és g-nek is. Megfordítva, ha f -nek és g-nek van közös gyöke, akkor a legnagyobb közös osztójuk nem lehet konstans, mert a közös gyök ennek is gyöke.
2.2.2. Primitív euklideszi algoritmus Amennyiben R euklideszi gyur u vagy alaptételes gyur u (amelyben érvényes a számelmélet állítás, miszerint bármely nem nulla és nem egység elem sorrendalaptételének megfelelo és egységszorzóktól eltekintve egyértelmuen tol bontható irreducibilis elemek szorzatára), akkor a helyzet bonyolultabb, hiszen R[x]-ben nem feltétlenül létezik euklideszi algoritmus. Szerencsére, mégis több módszer kínálkozik, melyek használhatóságának két oka van:
50
2. Komputeralgebra
(1) R[x] alaptételes gyur u, (2) alaptételes gyur uben két vagy több elem legnagyobb közös osztója mindig létezik. kínálkozó módszer az, hogy a legnagyobb közös osztó számítását R hányaAz elso dostestében végezzük el. A p(x)
∈ R[x] polinomot primitív polinomnak nevezzük, ha nincs
olyan R-beli prím, ami p(x) összes együtthatóját osztaná. Gauss híres lemmája szerint primitív polinomok szorzata is primitív, melynek következménye, hogy f , g primitív polinomok
= lnko( f , g) ∈ R[x], ha d = lnko( f , g) ∈
esetén pontosan akkor lesz d
H[x], ahol H jelöli R
H[x]hányadostestét. Vagyis az R[x]-beli legnagyobb közös osztó számítás visszavezetheto belire. Sajnos, ez a megközelítés nem igazán hatékony, mert a H hányadostestben használt aritmetika lényegesen költségesebb, mint az R-beli. Második lehetoségként egy, az euklideszi algoritmushoz hasonló algoritmus segíthet: integritási tartomány feletti egyhatározatlanú polinomgyur uben ún. pszeudo-maradékos osztást lehet deniálni. A (2.1), (2.2) polinomokat használva ha m q, r
≥ n, akkor létezik olyan
∈ R[x], hogy m−n+1
gn
ahol r
f
= gq + r ,
= 0 vagy deg r < deg g. A q polinomot az
f és g polinomok pszeudo-hányadosának,
az r polinomot pszeudo-maradékának nevezzük. Jelölésben q
= pquo( f , g), r = prem( f , g).
2.5. példa. Legyen
Ekkor pquo( f , g)
f (x)
=
12x
g(x)
=
−12x3 + 80x2 − 84x + 24 ∈ Z[x] .
= −144(x + 1),
4
− 68x3 + 52x2 − 92x + 56 ∈ Z[x] ,
prem( f , g)
(2.7) (2.8)
= 1152(6x2 − 19x + 10).
Másrészt egységszorzótól eltekintve minden f (x)
∈
R[x] polinom egyértelmuen írható
fel
f (x)
alakban, ahol cont( f )
∈
R és pp( f )
∈
= cont( f ) · pp( f )
R[x] primitív polinom. Ekkor cont( f )-et f összetevo
jének, pp( f )-et az f (x) polinom primitív részének nevezzük. A felírások egyértelmusége az el. Például egységek normalizálásával érheto
Z-ben az egységek {−1, 1} halmazából mindig
a pozitívat választjuk. Az alábbi algoritmus pszeudo-maradékos osztások sorozatát hajtja végre. Az algoritmus felhasználja a pszeudo-maradékot kiszámító prem() függvényt, feltételezi az R-beli legnagyobb közös osztó, valamint az R[x]-beli polinomok összetevojének és primitív részének kiszámíthatóságát. Bemenete az a, b algoritmus eredménye a lnko(a, b)
∈ R[x] polinomok, ∈ R[x] polinom.
ahol R alaptételes gyur u. Az
51
2.2. Polinomok közös gyökei
iteráció
r
1
108x
2
2
c 3x
4
− 342x + 108 − 414
621x
3
0
d
− 17x3 + 13x2 − 23x + 14 −3x3 + 20x2 − 21x + 6 2 6x − 19x + 10 3x − 2
−3x3 + 20x2 − 21x + 6 2 6x − 19x + 10 3x − 2 0
2.3. ábra. A P´-E algoritmus muködésének bemutatása az a(x) 56, b(x)
= 12x4 − 68x3 + 52x2 − 92x + = −12x3 + 80x2 − 84x + 24 ∈ Z[x] bemeno adatok esetén. A program elso két sora a bemeneti polinomok
iteráciprimitív részét számolja ki. A harmadik sortól a hatodik sorig tartó ciklus háromszor fut le, a különbözo ókban számolt r, c és d értékeket mutatja a táblázat. A program 7. sorában a P´-E(a, b) algoritmus eredményül 4
γ
változó értéke lnko(4, 4)
=
4. A
· (3x − 2)-t szolgáltat.
P´-E(a, b) 1 2 3 4 5 6 7 8 9
← pp( f ) ← pp(g) while d , 0 do r ← prem(c, d) c ← d d ← pp(r) γ ← lnko(cont(a), cont(b)) δ ← γc return δ c
d
Az algoritmus muködését a 2.3. ábra szemlélteti. A P´-E algoritmus futási idejének nagyságrendje megegyezik az euklideszi algoritmus korábban látott változatainak futási idejével. P´-E algoritmus azért nagyon lényeges, mert az R test feletti többváltozós R[x1 , x2 , . . . xt ] polinomgyur u alaptételes gyur u, így az algoritmust úgy alkalmazzuk, hogy kiszámoljuk a legnagyobb közös osztót mondjuk R[x2
. . . , xt ][x1 ]-ben, majd rekurzí-
van az R[x3 , . . . , xt ], . . . , R[xt ] alaptételes gyur ukben. Vagyis a többváltozós polinomgyur uk rekurzív szemlélete természetes módon vezet a P´-E algoritmus rekurzív alkalmazásához. Észrevehetjük, hogy az algoritmus a korábban látottakhoz hasonlóan együttható növekedést mutat. Vizsgáljuk meg részletesebben a
Z[x]
alaptételes gyur ut. A legnagyobb közös osztó
együtthatóinak nagyságára vonatkozó becslést az alábbi, bizonyítás nélkül közölt tétel mutatja.
=
2.3. tétel (LandauMignotte). Legyen a(x) bn , továbbá b(x)
Pm
| a(x). Ekkor n X
i=1
|bi | ≤ 2
n
i=0
i
ai x , b(x)
v tX m bn 2 ai . am
i=0
=
Pn
i=0
bi x
i
∈ Z[x], am ,
0
,
52
2. Komputeralgebra
2.4. következmény. Az eloz o tétel jelöléseivel az lnko(a, b)
∈ Z[x] polinom bármely együtt-
hatója abszolút értékben kisebb, mint
min{m,n}
2
· lnko(am , bn ) · min
v t m X
1
2
|am |
ai i=1
,
1
|bn |
v t n X
2
bi
.
i= 1
Bizonyítás. Az a és b polinomok legnagyobb közös osztója nyilván osztja a-t és b-t, a foka pedig legfeljebb az a és b polinomok fokainak minimuma. Továbbá a legnagyobb közös osztó foegyütthatója osztója am -nek és bn -nek is, így lnko(am , bn )-nek is.
2.6. példa. A 2.4. következmény szerint a (2.4), (2.5) polinomok legnagyobb közös osztója bármely együtthatójának abszolút értéke legfeljebb pedig legfeljebb b32
√
886c
b32/9
√
3197c
=
201, a (2.7), (2.8) polinomok esetében
= 952.
2.2.3. A rezultáns módszer a legáltalánosabb keretek között tárgyalja az (2.1), Az alábbiakban ismertetendo (2.2) polinomok közös gyökeire vonatkozó szükséges és elégséges feltételeket. További elonye, hogy magasabb fokú algebrai egyenletrendszerek megoldására is alkalmazható. Legyen tehát R egy integritási tartomány és H a hányadosteste. Tekintsük H-nak azt a legszukebb K bovítését, melyben a (2.1)-beli f (x) polinom és a (2.2)-beli g(x) polinom is
α1 , α2 , . . . , αm -nel, a β1 , β2 , . . . , βn -nel. Készítsük el a következo szorzatot:
lineáris faktorokra bomlik. Jelöljük az f (x) polinom (K-beli) gyökeit g(x) polinom gyökeit pedig
res( f , g)
n
=
m
fm gn (α1
− β1 )(α1 − β2 ) · · · (α1 − βn ) ·(α2 − β1 )(α2 − β2 ) · · · (α2 − βn ) .. . ·(αm − β1 )(αm − β2 ) · · · (αm − βn ) m Y n Y = fmn gm (αi − β j ) . n i=1
j=1
Nyilvánvaló, hogy res( f , g) akkor és csak akkor lesz 0, ha valamilyen i-re és j-re
αi = β j ,
azaz ha f -nek és g-nek van közös gyöke. Ezt a res( f , g) szorzatot az f és g polinomok rezultánsának nevezzük. Vegyük észre, hogy a rezultáns értéke függ az f és g polinomok azonban a különbözo sorrendben képzett rezultánsok legfeljebb csak elojelben sorrendjétol, térhetnek el egymástól:
res(g, f )
=
m
n
n Y m Y
gn fm j=1
=
(−1)
mn
n
(β j
− αi )
i=1 m
m Y n Y
(αi
fm gn
i=1
j=1
− β j ) = (−1)mn res( f , g) .
53
2.2. Polinomok közös gyökei
A rezultánsnak ez az alakja a gyakorlatban természetesen használhatatlan, mivel a gyö alakjait. Mivel kök ismeretét tételezi fel. Vizsgáljuk meg tehát a rezultáns különbözo f (x)
=
fm (x
− α1 )(x − α2 ) · · · (x − αm )
g(x)
=
gn (x
− β1 )(x − β2 ) · · · (x − βn )
( fm (gn
, 0) ,
, 0) ,
ezért g(αi )
=
gn (αi
− β1 )(αi − β2 ) · · · (αi − βn ) n Y gn (αi − β j ) .
=
j=1
Így res( f , g)
n
=
m Y
fm
n Y
i= 1 n
=
(αi
gn
− β j)
j=1
m Y
fm
g(αi )
= (−1)mn gm n
i= 1
n Y
f (β j )
.
j=1
Ámbár ez az alak sokkal barátságosabb, még mindig feltételezi legalább az egyik polinom gyökeinek ismeretét. Az alábbiakban azt nézzük meg, hogyan lehetne a rezultánst pusztán csak a polinomok együtthatói segítségével kifejezni. Ez a vizsgálat vezet el a rezultáns Sylvester-féle alakjához. Tegyük fel, hogy a (2.1)-beli f és a (2.2)-beli g polinomoknak van közös gyöke. Ez azt jelenti, hogy van olyan
α∈
f (α)
K szám, amelyre
= =
g(α)
+ fm−1 αm−1 + · · · + f1 α + f0 = 0 , n−1 gn α + gn−1 α + · · · + g1 α + g0 = 0 . m
fm α
n
A két egyenletet szorozzuk meg rendre az
αn−1 , αn−2 , . . . , α, 1, illetve az αm−1 , αm−2 , . . . , α, 1
egyenletbol n, a második egyenletbol m újabb egyenletet nyerünk. számokkal. Ekkor az elso Ezt az m + n egyenletet fogjuk úgy fel, mint egy m + n ismeretlenre vonatkozó homogén lineáris egyenletrendszert, melynek
αm+n−1 , αm+n−2 , . . . , α, 1 a megoldása. A megoldás nyilván
nem-triviális, hiszen 1 is a gyökök között szerepel. Ismert, hogy az olyan homogén lineáris áll, mint ahány ismeretlent tartalmaz, egyenletrendszernek, amely ugyanannyi egyenletbol csak abban az esetben van nemtriviális megoldása, ha a rendszer determinánsa zérus. Vagyis arra jutottunk, hogy f -nek és g-nek csak akkor lehet közös gyöke, ha a fm
D
=
gn
··· ··· .. .
···
fm
···
···
g0
··· .. .
..
f0
↑ ..
. ··· ··· ..
n f0
.
↓ ↑ m
..
. gn
···
. ···
g0
↓
(2.9)
54
2. Komputeralgebra
determináns nulla (a ki nem írt és nem pontozott helyeken mindenütt nullák állnak). A közös gyök létezésének tehát szükséges feltétele, hogy az (m + n)-edrendu D determináns 0 legyen. Az alábbiakban bebizonyítjuk, hogy a D determináns megegyezik az f és g polinomok
=
az következik, hogy D rezultánsával, amibol
0 a közös gyökök létezésének elégséges
feltétele is. A (2.9) determinánst nevezzük az f és g polinomok rezultánsa Sylvester-féle alakjának. 2.5. tétel. A korábbi jelölésekkel
D
=
m Y
n
fm
g(αi )
.
i=1
Bizonyítás. m-re vonatkozó teljes indukcióval dolgozunk. m
= 0-ra
f
=
fm
=
f0 , így a jobb
n 0
oldal f . A bal oldalon D egy n-edrendu determináns, melynek a foátlójában csupa f0 áll, a többi helyen pedig nulla. Így D m
=
n 0
f , az állítás tehát igaz. A továbbiakban tegyük fel, hogy
> 0 és hogy a bizonyítandó állítás n − 1-re igaz. Ha tehát ∗
f (x)
=
fm (x
− α1 ) · · · (x − αm−1 ) =
∗
fm−1 x
m−1
f helyett az
∗
+
fm−2 x
m−2
+ ··· +
∗
f1 x
+
∗
polinomot vesszük, akkor f ra és g-re az állítás teljesül:
∗
··· .. .
fm−1
∗ D
∗
···
···
g0
..
∗
···
fm−1
··· .. .
gn
=
···
f0
··· ..
=
∗
− αm ), ezért
fm
=
f (x
∗
fm−1 , fm−1
f és f
∗
=
∗
fm−2
. ···
∗
f0
=
∗m
m−1 Y
fm−1
g(αi )
.
i= 1
. ..
. ···
gn Mivel f
..
. ···
g0
együtthatói között az
−
∗
fm−1 αm , . . . , f1
=
∗
f0
−
∗
f1 αm , f0
= − f0∗ αm
összefüggések állnak fenn. Így
∗
fm−1
D
=
gn
∗
fm−2
− fm∗−1 αm .. . ··· .. .
···
· · · − f0∗ αm
∗
···
···
g0
fm−1
..
··· ..
..
. ···
− f0∗ αm .
. ..
. gn
···
. ···
g0
∗
f0
55
2.2. Polinomok közös gyökei
oszlop A determinánst a következoképpen alakítjuk át: az elso a második oszlophoz, az új második oszlop
αm -szeresét
n sorból eltunnek valamennyi oszlopon. Ezáltal az elso az
∗
n sora megegyezik a fenti D elso ki a második
αm -szeresét hozzáadjuk
a harmadik oszlophoz stb., végig
αm -ek,
vagyis az átalakított D
n sorával. Az utolsó m sorban az elsob ol vonjuk elso
a rákövetkezo αm -szeresét. Végül αm -szeresét, majd hasonlóan mindegyikbol
az alábbi determináns lesz: D-bol
∗
fm−1
D
··· ∗
···
···
g0
..
∗
···
fm−1
··· .. .
gn
=
··· .. .
f0
..
=
feltevés alapján D
i=1
.
.
··· gn
Qm
∗
f0
..
gn
n fm
. ···
···
.
Az utolsó oszlop szerint kifejtve, a D
..
=
. ··· gn αm + gn−1
g0
···
g(αm )
∗
az indukciós D g(αm ) egyenloséghez jutunk, amibol
g(αi ) következik.
Azt kaptuk tehát, hogy D
=
res( f , g), vagyis az f és g polinomoknak akkor és csak
akkor van közös gyökük K-ban, ha a D determináns eltunik. Algoritmikus szempontból magasabb fokú polinomok esetén a rezultáns Sylvester-féle alakjának kiszámolása egy nagy determináns kiszámítását jelenti. Az alábbi tétel szerint a pszeudo-maradékos osztás egyszerusítheti a számításokat. 2.6. tétel. A (2.1)-beli f és (2.2)-beli g polinomokra m
res( f , g)
= 0,
(m−n)(n−1)+d
gn
≥ n > 0 esetén
ha prem( f , g)
res( f , g)
= (−1)mn res(g, r),
ha r
=0,
= prem( f , g) , 0és d = deg(r) . m−n+1
sorát szorozzuk meg gn Bizonyítás. A (2.9) determináns elso qm−n x
m−n
+ · · · + q0 ∈
R[x] és r
=
rd x
d
+ · · · + r0 ∈
-gyel. Legyenek q
=
R[x] azok az egyértelmuen megha-
tározott polinomok, melyekre m−n+1
gn
( fm x
m
+ ··· +
f0 )
=
(qm−n x
m−n
+ · · · + q0 )(gn xn + · · · + g0 )
+ rd x d + · · · + r0 , ahol r
=
prem( f , g). Ekkor a rezultáns (n
+ 1)-edik
sorát qm−n -nel, az (n
sorból kivonva a qm−n−1 -gyel stb. szorozva, majd az elso
+ 2)-edik
sorát
56
2. Komputeralgebra
m−n+1 gn res( f , g) =
0
gn
···
0
rd
fm
··· .. .
···
··· .. .
··· ..
fm
···
···
g0
f0
..
. ···
f0
. ..
. ..
. ..
..
··· ··· ···
. ..
. ..
. gn
sor (m determinánst kapjuk. Itt rd az elso (m
· · · · · · r0 ··· ··· ···
···
···
. ···
g0
− d + 1)-edik oszlopában van, r0 pedig az elso sor
+ 1)-edik oszlopában. m−n+1
Hasonló módon folytatva szorozzuk meg a második sort gn meg az (n
+ 2)-edik,
(n
+ 3)-adik, . . .
második sorból. Ugyanígy a harmadik,
n(m−n+1) gn res( f , g) =
. . ., n-edik sorra. Az eredmény:
rd
··· .. .
··· ..
r0
··· .. .
··· ..
···
g0
..
..
..
···
. ···
r0
. ..
. ..
.
.
. ..
..
. rd
gn
-gyel, majd szorozzuk
sort qm−n -nel, qm−n−1 -gyel stb., és vonjuk ki oket a
. ..
. gn
···
···
. ···
g0
.
57
2.2. Polinomok közös gyökei
Sorcserék után azt kapjuk, hogy
n(m−n+1) mn gn res( f , g) = (−1)
··· .. .
gn
··· ..
···
g0
..
. ..
. gn
rd
··· .. . ··· .. .
···
. ···
g0
..
gn
. ··· ··· ···
···
r0
..
..
g0
. ..
. rd
···
. ···
r0
.
Vegyük észre, hogy
ezért
··· .. .
gn
··· .. .
rd
···
···
gn
···
···
r0
..
n(m−n+1)
amibol
··· ..
(m−n)(n−1)+d
. ···
g0
..
···
res( f , g)
gn
..
.
. rd
gn
g0
. ···
r0
= res(g, r) ,
−d = (−1)mn gm res(g, r) , n
res( f , g)
= (−1)mn res(g, r)
(2.10)
következik.
A (2.10) egyenlet egy nagyon fontos kapcsolatot ír le. Ahelyett, hogy az esetleg óriási méretu res( f , g) determinánst számítanánk ki, pszeudo-maradékos osztások sorozatát végezzük el, majd minden lépésnél (2.10)-et alkalmazzuk. Csak akkor számoljuk ki a rezultánst, el. A tétel fontos következménye az ha már több pszeudo-maradékos osztás nem végezheto alábbi 2.7. következmény. Léteznek olyan u, v deg u
< deg g, deg v < deg
∈ R[x] polinomok, melyre res( f , g) =
fu
+ gv, ahol
f.
Bizonyítás. A rezultáns determináns alakjában az i-edik oszlopot szorozzuk meg x és adjuk az utolsó oszlophoz minden i
m+n−i
-vel
= 1, . . . , (m + n − 1)-re. Az eredmény az alábbi lesz:
58
2. Komputeralgebra
res( f , g) =
fm
··· .. .
··· fm
···
gn
··· .. .
···
g0
f0
···
gn
··· .. . ··· ··· .. .
x
n−1
f
.. .
f x
m−1
···
g
.. .
g
.
A determinánst az utolsó oszlopa szerint kifejtve, majd f -et és g-t kiemelve kapjuk az állí egyenloséget tásban szereplo a fokokra vonatkozó megszorításokkal.
A rezultánsmódszer legfontosabb elonye a korábban látott módszerekhez képest, hogy a bemeneti polinomok szimbolikus együtthatókat is tartalmazhatnak. 2.7. példa. Legyen
Ekkor f és g
Q-beli
f (x)
=
g(x)
=
2x x
2
3
− ξ x2 + x + 3 ∈ Q[x] ,
− 5x + 6 ∈ Q[x] .
közös gyökeinek létezését az euklideszi algoritmus variánsai segítségével nem
tudjuk eldönteni, míg a rezultánsmódszerrel igen: pontosan akkor van közös gyök, ha
res( f , g) = vagyis ha
2
−ξ
1
3
2
−ξ
1
1
−5
6
1
−5
6
1
−5
2 = 36ξ − 429ξ + 1260 = 3(4ξ − 21)(3ξ − 20) = 0 ,
3
6
ξ = 20/3, vagy ξ = 21/4.
A rezultáns jelentosége nemcsak abban áll, hogy segítségével két polinom közös gyö hanem abban is, hogy használatával algebrai egyenletrendszerek kének létezése eldöntheto, egyismeretlenes algebrai egyenletek megoldására. rekurzív módon visszavezethetok 2.8. példa. Legyen f (x, y)
=
g(x, y)
=
x
2
+ xy + 2x + y − 1 ∈ Z[x, y] ,
(2.11)
x
2
+ 3x − y + 2y − 1 ∈ Z[x, y] .
(2.12)
2
Értelmezzük az f és g polinomokat úgy, mint (Z[x])[y]-beli elemeket. Pontosan akkor létezik közös gyökük, ha
resy ( f , g) = Z-beli
x
+1 0
−1
közös gyökök tehát az x
x
2
+ 2x − 1 x+1 2
∈ {−3, 0, 1}
0 x
2
x
2
+ 2x − 1 + 3x − 1
= − x3 − 2x2 + 3x = 0 .
esetben létezhetnek. Minden x-hez (immáron
Z[y]-ban)
visszahelyettesítéssel megoldjuk a (2.11), (2.12) egyenleteket, amikor is azt kapjuk, hogy az egyenletek egész megoldásai a (−3, 1), (0, 1), (1, −1) számpárok.
59
2.2. Polinomok közös gyökei
Megjegyezzük, hogy a rezultánsmódszer többváltozós polinomegyenlet-rendszerek megoldásainak megkeresésére is alkalmas, ámbár nem igazán hatékony. Az egyik probléma az, hogy a determináns kiszámítása során számítási tárrobbanás lép fel. Meggyelhetjük, hogy az egyhatározatlanú m és n-edfokú polinomok rezultánsa determináns alakjának kiszámítása a szokásos Gauss-eliminációval O((m + n) )-ös muveletigény u, míg az euklideszi 3
algoritmus változatai kvadratikusak. A másik probléma, hogy a számítási bonyolultság ero Sokkal hatékonyabb, ha a polinomegyenlet-rendszer sen függ a határozatlanok sorrendjétol. összes változóját egyszerre elimináljuk. Ez az út vezet el a többváltozós rezultánsok elméletéhez.
2.2.4. Moduláris legnagyobb közös osztó A polinomok közös gyökeinek létezésére és meghatározására szolgáló eddigi módszerek volt a számítási tárrobbanás. Ösztönösen vetodik mindegyikére jellemzo fel a kérdés: van-e lehetoség moduláris módszerek alkalmazására? Az alábbiakban az a(x), b(x) vizsgáljuk (a, b Ekkor
,
0). Tekintsük a (2.4), (2.5)
∈ Z[x]
∈ Z[x] esetet = 13 prím.
polinomokat és legyen p
Z p [x]-ben a K-E algoritmus maradéksorozata az alábbi lesz: r0 r1 r2 r3 r4 r5
= = = = = =
+ 5x4 + 6x3 + 6x2 + 5 , 4 3 2 x + x + 2x + 8x + 8 , 3 2 3x + 8x + 12x + 1 , 2 x + 10x + 10 , 7x , 10 .
11x
5
Azt kapjuk tehát, hogy Z p [x]-ben az a és b polinomok relatív prímek. Az alábbi Z[x]-ben és Z p [x]-ben vett legnagyobb közös osztók közötti kapcsolatot írja le.
tétel a
2.8. tétel. Legyen a, b
∈ Z[x], a, b , 0. Legyen p olyan prím, amelyre p 6 | lc(a) és p 6 | lc(b). = lnko(a, b) ∈ Z[x], a p = a rem p, b p = b rem p és c p = c rem p. Ekkor (1) deg lnko(a p , b p ) ≥ deg lnko(a, b) , (2) ha p 6 | res(a/c, b/c), akkor lnko(a p , b p ) = c p .
Legyen továbbá c
| a p és c p | b p ezért c p | lnko(a p , b p ). Így deg lnko(a p , b p ) ≥ deg lnko(a, b) mod p . Azonban a feltételek miatt p 6 | lc lnko(a, b) , ezért deg lnko(a, b) mod p = deg lnko(a, b) .
Bizonyítás. (1) bizonyítása: mivel c p
(2) bizonyítása: mivel lnko(a/c, b/c)
= 1, valamint c p
lnko(a p , b p ) Ha lnko(a p , b p )
,
nemtriviális, ezért
= c p · lnko(a p /c p , b p /c p ) .
c p , akkor (2.13) jobb oldala nemtriviális, így res(a p /c p , b p /c p )
szorzatainak összege, így p De a rezultáns az együtthatók megfelelo ellentmondás.
(2.13)
|
=
0.
res(a/c, b/c), ami
60
2. Komputeralgebra
2.9. következmény. Véges sok olyan p prím van, amire p deg lnko(a p , b p ) > deg lnko(a, b) .
6|
lc(a), p
6|
lc(b) és
Amikor a 2.8. tétel (1) állításában egyenloség teljesül, akkor azt mondjuk, hogy p egy szerencsés prím. Máris körvonalazhatunk egy legnagyobb közös osztót kiszámoló modu láris algoritmust. M --´(a, b) ´ 1 2 3 4 5 6
← a LandauMignotte-konstans (a 2.4. következmény szerint) ← {} while do p ← olyan prím, melyre p ≥ 2M, p < H, p 6 | lc(a) és p 6 | lc(b) c p ← lnko(a p , b p ) if c p | a és c p | b M
H
7
then return c p
8
else H
←
H
∪ { p}
sora a LandauMignotte-korlát kiszámítását kéri. A negyedik sor szerint Az algoritmus elso elég nagy prímet kell választani, amely nem osztja sem a, sem b foegyütthatóját. Az ötödik sor (például a Z p [x]-beli K-E algoritmussal) kiszámolja az a
olyan
és b polinomok legnagyobb közös osztóját modulo p. A kapott polinom együtthatóit szimmetrikus ábrázolással tároljuk. A hatodik sor c p
| a és c p | b teljesülését vizsgálja, melynek
igazsága esetén c p a keresett legnagyobb közös osztó. Ha ez nem teljesül, akkor p egy szerencsétlen prím, így új prímet választunk. Mivel a 2.8. tétel szerint csak véges sok szerencsétlen prím van, ezért az algoritmus elobb-utóbb véget ér. Amennyiben a prímeket stratégia szerint választjuk, a H halmaz alkalmazása szükségtelen. megfelelo A M --´ hátránya, hogy a bemeneti polinomok fokszámának növe´ így ez esetben nagy prímekkel kedtével a LandauMignotte-konstans exponenciálisan no, kell számolni. Felmerül a kérdés, hogyan módosítsuk az algoritmust, hogy mel számolhassunk? Mivel
sok kis prím
Z p [x]-ben a legnagyobb közös osztó az együtthatók konstans-
sal vett szorzata erejéig egyértelmu, ezért az új algoritmusban ügyelni kell a részpolino tehát a kínai maradéktételt alkalmazzuk a különbözo prímekmok együtthatóira. Mielott kel vett moduláris legnagyobb közös osztók együtthatóira, minden lépésnél normalizálni kell az lnko(a p , b p ) foegyütthatóját. Amennyiben am és bn az a és b polinomok foegyütt hatói, akkor lnko(a, b) foegyütthatója osztja lnko(am , bn )-t. Primitív a és b polinomok ese tén lnko(a p , b p ) foegyütthatóját ezért lnko(am , bn ) mod p-re normalizáljuk, majd a legvégén vesszük az eredmény polinom primitív részét. Ahogy a M --´ algo´ ritmusnál, a moduláris számítások eredményét most is szimmetrikus ábrázolással tároljuk. Ezek a meggondolások vezetnek az alábbi, kis prímeket használó moduláris legnagyobb közös osztó algoritmushoz. M --´(a, b) ´
← lnko( lc(a), lc(b)) ← olyan prím, melyre H ← { p}
1
d
2
p
3
p
6| d
61
2.2. Polinomok közös gyökei
4 5 6 7 8 9
←p ← lnko(a p , b p ) g p ← (d mod p) · c p (n, i, j) ← (3, 1, 1) while do if j = 1 P
cp
10
then if deg g p
11
=0
then return 1 (g, j, P)
12 13
if n
14
← (g p , 0, p)
≤i
then g
15
← pp(g) | a és g | b
if g
16
then return g
← olyan prím, melyre p 6 | d és p < H H ← H ∪ { p} c p ← lnko(a p , b p ) g p ← (d mod p) · c p if deg g p < deg g then (i, j) ← (1, 1) if j = 0 then if deg g p = deg g then g1 = EH-´ ´(g, g p , P, p) if g1 = g then i ← i + 1 else i ← 1 P ← P· p g ← g1
17
p
18 19 20 21 22 23 24 25 26 27 28 29 30
EH-´ ´(a, b, m1 , m2 )
6
←0 ← 1/m1 mod m2 for i ← deg a downto 0 do r ← ai mod m1 s ← (bi − r) mod m2 i p ← p + (r + s · m1 )x
7
return p
1 2 3 4 5
p
c
Észrevehetjük, hogy a M --´ algoritmusban nincs szükség annyi kis ´ prímre, mint amennyit a LandauMignotte-korlát meghatároz. Amennyiben a g polinom értéke néhány iteráción keresztül nem változik, a 1316. sorokban teszteljük, hogy g valóban a legnagyobb közös osztó-e. Ezen iterációk számát tárolja a hatodik sor n változója. Megjegyezzük, hogy n értékét a bemeneti polinomoktól függoen változtatni is lehetne. Az algoritmusban használt prímeket célszeru egy olyan elore eltárolt listából választani, amely gépi szóban elféro prémeket tartalmazza; ilyenkor a H halmaz az architektúrának megfelelo
62
2. Komputeralgebra
használata szükségtelen. A 2.9. következmény miatt a M --´ algorit´ mus befejezodik. Az EH-´ ´ algoritmus a bemeneti a, b polinomok azonos fokú tagjainak együtthatóira felírt, modulo m1 és m2 vett két lineáris kongruenciából álló egyenletrendszer megoldását számolja ki a kínai maradéktételnek megfeleloen. Nagyon fontos, hogy az eredmény polinom együtthatóit szimmetrikus ábrázolással tároljuk. 2.9. példa. Eloször vizsgáljuk meg M --´ algoritmus muködését a korábban is ´ vizsgált (2.4), (2.5) polinomokra. A könnyebb érthetoség kedvéért kis prímekkel fogunk számolni. Emlékeztetoül, a(x)
=
63x
b(x)
=
−77x4 + 66x3 + 54x2 − 5x + 99 ∈ Z[x] .
5
+ 57x4 − 59x3 + 45x2 − 8 ∈ Z[x] ,
= 7, c p = x2 + 3x + 2 és g p = 2x + x − 1 lesznek. Mivel a 7. sor miatt a j változó értéke 1, ezért a 1012. sorok végrehajtódnak. 2 A g p polinom nem nulla, ezért g = 2x + x − 1, j = 0, valamint P = 5 lesznek a végrehajtás utáni változóértékek. A 13. sorban a feltétel értéke nem teljesül, így újabb prímet választunk. A p = 7 rossz választás, a p = 11 viszont megengedett. A 1920. sorok szerint ekkor c p = 1, g p = −4. Mivel deg g p < deg g, ezért j = 1 lesz és a 2530. sorok nem hajtódnak végre. A g p polinom konstans, így a 11. sorban a visszatérési érték 1 lesz, jelezve, hogy az a és b polinomok relatív prímek.
hat sorának végrehajtása után a p Az algoritmus elso
=
5 választással d
2
2.10. példa. Második példánkban tekintsük a korábbi a(x)
=
12x
b(x)
=
−12x3 + 80x2 − 84x + 24 ∈ Z[x] ,
4
− 68x3 + 52x2 − 92x + 56 ∈ Z[x] ,
= 5. Az algoritmus elso hat sora után d = 12, c p = x + 1, g p = 2x + 2. A = 5, g = 2x + 2 lesznek a változók értékei. A következo prím legyen p = 7. Így az új értékek c p = x + 4, g p = −2x − 1. Mivel deg g p = deg g, ezért a 2530. sorok után prímet válasszuk P = 35 és g új értéke 12x − 8 lesz. Az i változó értéke továbbra is 1. A következo 11-nek. Ekkor c p = g p = x + 3. A g p és g fokai megegyeznek, így g együtthatóit módosítjuk. Ekkor g1 = 12x − 8 és mivel g = g1 , ezért i = 2, valamint P = 385 lesznek. Az új prím legyen 13. Ekkor c p = x + 8, g p = − x + 5. A g p és g fokai továbbra is megegyeznek, ezért a 2530 sorok végrehajtódnak, a változók értékei g = 12x − 8, P = 4654, i = 3 lesznek. A 1718. sorok végrehajtása után kiderül, hogy g | a és g | b ezért a legnagyobb közös osztó g = 12x − 8. polinomokat. Legyen ismét p
1012. sorok végrehajtása után P
Az alábbi tételt bizonyítás nélkül közöljük. 2.10. tétel. A M --´ algoritmus megfeleloen muködik. Az algoritmus ´ 3
számítási bonyolultsága O(m (log m
+ λ(K))2 )
gépi szóban mért muvelet, ahol m
=
min{deg a, deg b}, K pedig az a és b polinomok LandauMignotte-korlátja.
Gyakorlatok 2.2-1.
Pn
Legyen R egy kommutatív egységelemes gyur u, a
=
Pm
i=0
ai x
i
∈
R[x], b
=
bi x ∈ R[x], továbbá bn egység, m ≥ n ≥ 0. Az alábbi algoritmus az a és b polinomoki= 0 kal végzett maradékos osztás eredményeként eloállítja azokat a q, r ∈ R[x] polinomokat, i
melyekre a
= qb + r és deg r < n vagy r = 0.
63
2.3. Gröbner-bázis
E ´ --´ - ´ ´ (a, b)
7
←a ← m − n downto 0 do if deg r = n + i then qi ← lc(r)/bn i r ← r − qi x b else q ← 0 Pm−n i i q ← qi x és r i=0
8
return q
1 2 3 4 5 6
r
for i
Bizonyítsuk be, hogy az algoritmus legfeljebb (2 deg b
+ 1)(deg q + 1) = O(m2 )
R-beli muveletet igényel. 2.2-2. Mi a különbség
Z-ben a B ´-E és a B ´-E-N ´
algoritmusok között?
· g, h) = res( f , h) · res(g, h). ∈ R[x] polinom (deg f = m, lc( f ) = fm ) diszkriminánsának a
2.2-3. Bizonyítsuk be, hogy res( f 2.2-4. Az f (x)
discr f elemet nevezzük, ahol f
0
=
(−1)
m(m−1) 2
0
res( f , f )
fm
∈R
az f x-beli deriváltját jelenti. Az f polinomnak nyilván akkor és
csak akkor van többszörös gyöke, ha diszkriminánsa nulla. Számítsuk ki (discr f )-et általános másod- és harmadfokú polinomok esetében.
2.3. Gröbner-bázis Legyen F test, R
=
F[x1 , x2 , . . . , xn ] az F feletti n-határozatlanú polinomok gyur uje, to-
vábbá legyen f1 , f2 , . . . , f s
∈
R. Állapítsuk meg, hogy mi annak a szükséges és elégséges
feltétele, hogy az f1 , f2 , . . . , f s polinomoknak legyen közös gyöke R-ben. Látható, hogy a o alfejezet s probléma az eloz
= 2 esetének bizonyos értelemben vett általánosítása.
Jelölje I
= h f1 , . . . , f s i =
X
qi fi : qi
∈R
1≤i≤ s
az f1 , . . . , f s polinomok által generált ideált. Ekkor az f1 , . . . , f s polinomok az I ideál bázisát alkotják. Az I ideál varietásán a
V (I)
=
u
∈
F
n
: f (u)
=0
minden f
∈
I polinomra
halmazt értjük. A varietás ismerete természetesen az f1 , . . . , f s polinomok közös megoldása legfontosabb kérdések: inak ismeretét is jelenti. A varietásról, illetve az I ideálról felteheto
•
V (I)
,∅?
64
2. Komputeralgebra
•
V (I)
•
Adott f
•
I
mekkora ?
∈ R esetén
f
∈
I?
=R?
Az I ideál Gröbner-bázisa egy olyan bázis, ahol ezeket a kérdéseket könnyu megválaszolni. vizsgáljuk meg az n Mindenekelott
= 1 esetet. Mivel F[x] euklideszi gyur u, ezért
h f1 , . . . , f s i = h lnko( f1 , . . . , Feltehetjük, hogy s
=
2. Legyen f , g
egyértelmuen léteznek olyan q, r
∈
∈
fs )
i.
(2.14)
F[x], és osszuk el maradékosan f -et g-vel. Ekkor
F[x] polinomok, melyekre f
= qg+r, ahol deg r < deg g.
Vagyis f továbbá V (g)
= {u1 , . . . , ud },
∈ hgi ⇔ r = 0 ,
amennyiben x
−
u1 , . . . , x
−
ud a g
∈
F[x] polinom összes
lineáris faktora. Sajnos, a (2.14) egyenloség különbözo két vagy több határozatlan esetén akármilyen test feletti többváltozós polinomgyur már nem teljesül. Sot, u nem euklideszi gyur u, így a maradékos osztás lehetoségét is újra kell gondolni. Ebben az irányban haladunk tovább.
2.3.1. Monomiális rendezés A ` `
⊆ Nn teljes rendezési relációt megengedettnek nevezzük, ha n (i) (0, . . . , 0) v minden v ∈ N -re, n (ii) minden v1 , v2 , v ∈ N esetén v1 v2 ⇒ v1 + v v2 + v. n Nem nehéz bizonyítani, hogy N minden megengedett rendezése
egyben jólrendezés is
(vagyis bármely nemüres részhalmazának van legkisebb eleme). A korábbi jelöléseket gyelembe véve tekintsük a T
= { x1i · · · xni } 1
n
halmazt, melynek elemeit monomoknak nevezzük. Vegyük észre, hogy T
zárt az
F[x1 , . . . , xn ]-beli szorzásra, valamint a muvelettel kommutatív monoidot alkot. Az T , (i1 , . . . , in )
7→
x
i1
1
· · · xni
n
leképezés izomorzmus, ezért egy T -beli
Nn →
megengedett teljes
rendezésre (i) 1
t minden t ∈ T -re, ∈ T esetén t1 ≺ t2 ⇒ t1 t ≺ t2 t.
(ii) minden t1 , t2 , t
A T -beli megengedett rendezéseket monomiális rendezéseknek nevezzük. Tekintsünk néhány példát. Legyen
α=
x
i1
1
· · · xni , β = n
x
j1 1
· · · xnj ∈ T . n
Ekkor az alábbi rendezéseket szokás deniálni.
•
Lexikograkus rendezés.
α ≺lex β ⇔ létezik olyan l ∈ {1, . . . , n}, hogy il < •
jl és il+1
=
jl + 1 , . . . , in
=
jn .
Tiszta lexikograkus rendezés.
α ≺ plex β ⇔ létezik olyan l ∈ {1, . . . , n}, hogy il <
jl és i1
=
j1 , . . . , il − 1
=
jl−1 .
65
2.3. Gröbner-bázis
•
Összfokszám szerint, majd lexikograkus rendezés.
α ≺grlex β ⇔ i1 + · · · + in < •
+ ··· +
j1
jn vagy (i1
+ · · · + in =
j1
+ ··· +
jn és
α ≺lex β).
Összfokszám szerint, majd fordított lexikograkus rendezés.
α ≺tdeg β ⇔ i1 + · · · + in < j1 + · · · + jn vagy (i1 + · · · + in = ∈ {1, . . . , n}, melyre il > jl és il+1 = jl+1 , . . . , in = jn ).
j1
+···+
jn és létezik olyan
l
≺grrevlex -nek jelölik ( graded reverse lexicogA ≺tdeg monomiális rendezést némely szerzok raphic order), hiszen a rendezés a monomok fokszámösszehasonlítás utáni lexikograkus rendezésének felel meg. 2.11. példa. Legyen
≺=≺ plex . Ekkor z ≺ y ≺ ≺
1
z
≺
y
≺ Legyen
≺=≺tdeg . Ekkor z ≺ y ≺
x esetén
≺ z2 ≺ · · · ≺ y ≺ yz ≺ yz2 ≺ · · · 2
xy
≺ y2 z ≺ y2 z2 ≺ · · · x ≺ ≺
xy
2
≺ ··· ≺
x
2
xz
≺
xz
2
≺ ···
≺ ··· .
x esetén
1
≺
z
≺
z
2
≺ yz ≺
≺
z
3
≺ yz2 ≺
2
≺y ≺
≺
≺y≺
x z
x
3
xz
≺ y2 ≺
xz
2
xy
2
xy
≺ y2 z ≺ ≺
2
x y
≺
x
2
xyz
≺
x
3
≺ ··· .
A továbbiakban mindig feltesszük, hogy valamilyen rögzített monomiális rendezés
P
α ∈ R egy nem nulla polinom, cα ∈ F és α∈Nn cα x α monomiális rendezés. Ekkor cα x (cα , 0) az f polinom tagjai,
mellett dolgozunk. Legyen f
=
≺ = max{α ∈ Nn : cα , 0} a polinom multifoka (a maximum a monomiális rendezés mdeg( f ) lc( f ) = cmdeg( f ) ∈ F \ {0} a polinom foegyütthatója, mellett értendo), lm( f ) = x ∈R a polinom fomonomja, lt( f ) = lc( f ) · lm( f ) ∈ R a polinom fotagja. Legyenek továbbá lt(0) = lc(0) = lm(0) = 0 és mdeg(0) = −∞. legyen adott egy mdeg( f )
2.12. példa. Tekintsük az f (x, y, z)
≺=≺ plex
és z
≺y≺
mdeg( f ) ha pedig
≺=≺tdeg
= 2xyz2 − 3x3 + 4y4 − 5xy2 z ∈ Q[x, y, z] polinomot. Amennyiben
x, akkor
és z
≺y≺
= (3, 0, 0),
lt( f )
= −3x3 ,
lm( f )
=
,
lc( f )
= −3 ,
= 4y4 ,
lm( f )
= y4 ,
lc( f )
=4.
x
3
x, akkor
mdeg( f )
= (0, 4, 0),
lt( f )
2.3.2. Többváltozós polinomok maradékos osztása Ebben a pontban adott f , f1 , . . . , f s rendezés esetén olyan q1 , . . . , q s
∈
∈
R többváltozós polinomok és adott
R és r
∈
≺
monomiális
R polinomokat keresünk, melyekre f
· · · + q s f s + r és r egyetlen monomja sem osztható lt( f1 ), . . . , lt( f s ) egyikével sem.
=
q1 f 1
+
66
2. Komputeralgebra
T ´ --´ - ¨ ´ ´ ( f , f1 , . . . , f s )
←0 ← f for i ← 1 to s do qi ← 0 while p , 0
1
r
2
p
3 4 5 6
∈ {1, . . . , s}-re lt( fi ) | lt( p) ← qi + lt( p)/ lt( fi ) p ← p − lt( p)/ lt( fi ) fi r ← r + lt( p) p ← p − lt( p)
do if valamilyen i
7
then az egyik ilyen i-re qi
8 9
else
10
return q1 , . . . , q s és r
11
Az algoritmus helyes muködése abból következik, hogy az 510. sorok while ciklusának minden iterációjában fennállnak az alábbi tulajdonságok:
mdeg( f ) és f = p + q1 f1 + · · · + g s f s + r, , 0 ⇒ mdeg(qi fi ) mdeg( f ) minden 1 ≤ i ≤ s esetén,
(i) mdeg( p) (ii) qi
(iii) r egyetlen tagja sem osztója egyik lt( fi )-nek sem. Algoritmusunknak van egy gyenge pontja: a többváltozós polinomok maradékos osztása i értékek közül tetszolegesen nem egyértelmu. A 7. sorban a megfelelo választhatunk. 2.13. példa. Legyen f y
≺ plex
=
x y + xy 2
2
+ y2 ∈ Q[x, y],
f1
=
xy − 1, f2
= y2 − 1, a monomiális rendezés ≺ plex ,
i értéket válasszuk. Ekkor az algoritmus x, és a 7. sorban mindig a legkisebb indexu megfelelo
= x + y, q2 = 1, r = x + y + 1. De ha f1 és f2 szerepét felcseréljük, vagyis = xy − 1, akkor az algoritmus kimenete q1 = x + 1, q2 = x és r = 2x + 1 lesz.
eredménye q1 f2
f1
= y2 − 1 és
Az iménti példában látott módon (nevezetesen, hogy az pszeudokód 7. sorában mindig pozitív i értéket választjuk) az algoritmus determinisztikussá teheto. a legkisebb megfelelo Ilyenkor a q1 , . . . , q s hányadosok és az r maradék egyértelmu, amit úgy jelölünk, hogy r
=
f rem ( f1 , . . . , f s ). Az s
=
1 esetben az algoritmus választ ad az ideál-tartalmazás problémájára: f
∈ h f1 i
akkor és csak akkor, ha az f polinom f1 polinommal vett maradékos osztásakor a maradék nulla. Sajnos s
≥ 2 esetén ez nem teljesül: a ≺ plex xy
2
−x
rem (xy
mutatja, hogy xy
+ 1, y2 − 1) = − x − y,
viszont = y, q2 = 0. Másrészrol − x ∈ h xy + 1, y2 − 1i.
a hányadosok pedig q1 2
monomiális rendezéssel
xy
2
−x=
x
· (y2 − 1) +
0, ami azt
2.3.3. Monomiális ideálok és Hilbert-féle bázistétel További célunk tetszoleges polinomideálhoz olyan bázis keresése, hogy ezzel a bázissal vett maradékos osztáskor a maradék egyértelmu legyen, így választ tudjunk adni az ideáltartalmazás problémára. Vajon ilyen bázis egyáltalán létezik? És ha igen, véges elemszámú? Az I
⊆ R ideált monomiális ideálnak nevezzük, ha létezik olyan A ⊆ Nn , melyre I
= h xA i = h{ xα ∈ T : α ∈ A}i ,
vagyis az ideált monomok generálják.
67
2.3. Gröbner-bázis
2.11. lemma. Legyen I
= h xA i ⊆ R egy monomiális ideál, és β ∈ Nn . Ekkor x
Bizonyítás. A melyekre x
β
=
β
∈ I ⇔ ∃α ∈
A
x
α
|
x
β
.
⇐ irány nyilvánvaló. Megfordítva, legyen α1 , . . . , α s ∈ P α α i
β
qi x i . Ekkor az összegnek legalább egy olyan qi x
x elofordul, így x
αi
|
i
A és q1 , . . . , q s
∈
R,
tagja létezik, melyben
β
x .
A lemma legfontosabb következménye, hogy monomiális ideálok pontosan akkor egyeznek meg, ha ugyanazokat a monomokat tartalmazzák. 2.12. lemma (Dickson-lemma). minden A
Minden monomiális ideál végesen generálható, vagyis
⊆ Nn -hez létezik olyan B ⊆
A véges halmaz, melyre h x
= F[x1 , . . . , xn ]-ben. Ha G ⊆ = hlt(I)i, akkor hGi = I.
2.13. lemma. Legyen I egy ideál R melyre hlt(G)i
A
i = h x B i.
I egy olyan véges halmaz,
= {g1 , . . . , g s }. Ha f ∈ I egy tetszoleges polinom, akkor G-vel vett = q1 g1 + · · · + q s g s + r, ahol q1 , . . . , q s , r ∈ R olyanok, hogy vagy r = 0, vagy r egyetlen tagja sem osztható egyetlen gi fotagjával sem. De ekkor r = f − q1 g1 − · · · − g s g s ∈ I, és így lt(r) ∈ lt(I) ⊆ hlt(g1 ), . . . , lt(g s )i. A (2.11) lemma miatt ezért r = 0, vagyis f ∈ hg1 , . . . , g s i = hG i.
Bizonyítás. Legyen G
maradékos osztás szerint f
Amennyiben a Dickson-lemmát
hlt(I)i-re
alkalmazzuk, továbbá gyelembe vesszük,
hogy a zérópolinom a h0i ideált generálja, az alábbi nevezetes eredményt kapjuk. 2.14. tétel (Hilbert-féle bázistétel). Minden I ható, vagyis létezik olyan G
⊆
⊆
R
=
∈ N, melyre In =
In+1
=
I és hlt(G)i
⊆ I2 ⊆ · · · = ··· .
2.15. következmény (ideállánc-feltétel). Legyen I1 lánca. Ekkor létezik olyan n
F[x1 , . . . , xn ] ideál végesen generál-
I véges halmaz, melyre hG i
= hlt(I)i.
R-beli ideálok egy növekvo
= ∪ j≥1 I j . Ekkor I ideál, ami a Hilbert-féle bázistétel miatt végesen = hg1 , . . . , g s i. Az n = min{ j ≥ 1 : g1 , . . . , g s ∈ I j } választással azt = In+1 = · · · = I.
Bizonyítás. Legyen I
generálható. Legyen I kapjuk, hogy In
Azokat a gyur uket, melyekben teljesül az ideál-lánc feltétel, Noether-gyur uknek nevezzük. Speciálisan, amennyiben F test, akkor F[x1 , . . . , xn ] Noether-gyur u. Legyen az I ideál
≺
≺
egy monomiális rendezés R-en és I
⊆
Hilbert-féle bázistétel következménye az alábbi
⊆ I véges halmazt hlt(G)i = hlt(I)i. A
R egy ideál. A G
rendezésre vonatkozó Gröbner-bázisának nevezzük, ha
68
2. Komputeralgebra
2.16. következmény. R
=
F[x1 , . . . , xn ] minden I ideáljának van Gröbner-bázisa.
Könnyu megmutatni, hogy egy G Gröbner-bázissal vett maradékos osztáskor a maradék
=
Ilyenkor az f rem G nem függ a báziselemek sorrendjétol.
r
∈
R jelölés használatos. Az
alábbi tétel szerint a Gröbner-bázis segítségével az ideál-tartalmazás problémája egyszeruen megválaszolható.
⊆ R ideál ≺ monomiális rendezésre vonatkozó Gröbner-bázisa és ∈ I ⇔ f rem G = 0.
2.17. tétel. Legyen G az I legyen f
∈ R. Ekkor
f
Bizonyítás. Bebizonyítjuk, hogy egyértelmuen létezik olyan r
∈ R, amelyre (1) f − r ∈
I, (2)
r egyetlen tagja sem osztható lt(G) egyetlen monomjával sem. Ilyen r létezése a maradékos osztásból következik. Az egyértelmuséghez feltesszük, hogy f h1 , h2
∈
g
− r2 = h2 − h1 ∈ I, továbbá a 2.11. lemma ∈ G-re. Ez azt jelenti, hogy r1 − r2 = 0.
h
=
r1
= h1 +r1 = h2 +r2 valamilyen
I-re és r1 vagy r2 egyik tagja sem osztható lt(G) egyetlen monomjával sem. Ekkor miatt lt(r1
− r2 )
Ha tehát G az R egy Gröbner-bázisa, akkor minden f , g, h f rem G
osztható lt(g)-vel valamely
∈
R esetén g
=
f rem G és
⇒ g = h.
2.3.4. A Buchberger-algoritmus Észrevehetjük, hogy a Hilbert-féle bázistétel nem konstruktív: nem ad választ arra, hogyan konstruáljuk meg egy I ideál Gröbner-bázisát. Az alábbiakban úgy okoskodunk, hogy azt vizsgáljuk, egy véges halmaz mikor nem Gröbner-bázisa az I ideálnak. Legyenek g, h (β1 , . . . , βn )
=
∈
R nem nulla polinomok,
mdeg(h),
γ =
polinomján az S (g, h)
=
x
γ
lt(g)
g
polinomot értjük. Észrevehetjük, hogy S (g, h) így S (g, h)
∈ hg, hi.
α =
(α1 , . . . , α n )
=
mdeg(g),
β =
(max{α1 , β1 }, . . . , max{αn , βn }). A g és h polinomok S-
−
x
γ
lt(h)
h
∈R
= −S (h, g),
továbbá x
γ
/ lt(g), xγ / lt(h) ∈
R
bizonyítás nélkül közölt tétel egy egyszeru A most következo, tesztet
ad egy halmaz Gröbner-bázis mivoltára. 2.18. tétel. A G
= {g1 , . . . , g s } ⊆
R halmaz akkor és csak akkor lesz a hG i ideál Gröbner-
bázisa, ha S (gi , g j ) rem (g1 , . . . , g s )
=0
minden 1
≤i< j≤
s esetén .
Az S -polinomok segítségével könnyen adható Gröbner-bázist konstruáló algoritmus (Buchberger, 1965): adott f1 , . . . , f s
∈
R
az alábbi algoritmus megadja az I
= F[x1 , . . . , xn ] és adott ≺ monomiális rendezés mellett = h f1 , . . . , f s i ideál egy G ⊆ R Gröbner-bázisát.
69
2.3. Gröbner-bázis
G - ( f1 , . . . , f s ) ¨ ´
← { f1 , . . . , f s } ← {( fi , f j ) | fi , f j ∈ G, i < j, fi , f j } while P , ∅ do ( f , g) ← egy tetszoleges pár P-bol P ← P \ ( f , g) r ← S ( f , g) rem G if r , 0 then G ← G ∪ {r } P ← P ∪ {( f , r) | f ∈ G }
1
G
2
P
3 4 5 6 7 8 9 10
return G
Eloször megmutatjuk, hogy a G - algoritmus helyesen muködik. Az algoritmus ¨ ´ futásának bármely pillanatában G az I ideál bázisa, hiszen kezdetben az, a továbbiakban képzett S-polinomok Gpedig kizárólag olyan elemek kerülnek G-be, melyeket G elemeibol vel vett maradékos osztásaként kapunk. Amennyiben az algoritmus befejezodik, az összes S -polinom G-vel vett maradéka nulla, így a (2.18) tétel miatt G egy lehetséges képezheto Gröbner-bázis. Most bebizonyítjuk, hogy az algoritmus befejezodik. Legyenek G és G
∗
a pszeudo-
végrehajtásakor kapott halmazok. Nyilván G kód while ciklusa két egymást követo
⊆
∗
G ,
∗
hlt(G)i ⊆ hlt(G )i. De a (2.15) következmény miatt az egymást követo iterációk hlt(G)i ideállánca stabilizálódik, vagyis véges számú lépés után hlt(G)i = hlt(G∗ )i teljesül. ∗ ∗ Azt állítjuk, hogy ekkor G = G . Legyen f , g ∈ G és r = S ( f , g) rem G. Ekkor r ∈ G és ∗ a maradék képzésének deníciója miatt vagy r = 0 vagy lt(r) ∈ hlt(G )i = hlt(G)i, amibol r = 0 következik.
továbbá
= Q, ≺=≺ plex , z ≺ y ≺ x, f1 = x − y − z, f2 = x + y − z2 , f3 = x2 + y2 − 1. Ekkor sora miatt G = { f1 , f2 , f3 }, a második sorból pedig P = {( f1 , f2 ), ( f1 , f3 ), ( f2 , f3 )}. a pszeudokód elso végrehajtása során válasszuk az ( f1 , f2 ) párt. Ekkor P = {( f1 , f3 ), ( f2 , f3 )}, A while ciklus elso 2 2 S ( f1 , f2 ) = −2y − z + z és r = f4 = S ( f1 , f2 ) rem G = −2y − z + z . Ezért G = { f1 , f2 , f3 , f4 } és P = {( f1 , f3 ), ( f2 , f3 ), ( f1 , f4 ), ( f2 , f4 ), ( f3 , f4 )}. A ciklus második végrehajtásakor válasszuk az ( f1 , f3 ) párt. Ekkor P = P \ { f1 , f3 }, S ( f1 , f3 ) = − xy − xz − y2 + 1, r = f5 = S ( f1 , f3 ) rem G = −1/2z4 − 1/2z2 + 1, így G = { fi | 1 ≤ i ≤ 5} és P = {( f2 , f3 ), ( f1 , f4 ), . . . , ( f3 , f4 ), ( f1 , f5 ), . . . , ( f4 , f5 )}. A ciklus harmadik végrehajtása során válasszuk az ( f2 , f3 ) párt. Ekkor P = P \ {( f2 , f3 )}, 2 2 S ( f2 , f3 ) = xy − xz − y + 1, r = S ( f2 , f3 ) rem G = 0. A while ciklus negyedik végrehajtása során válasszuk az ( f1 , f4 ) párt. Ekkor P = P \ { f1 , f4 }, 2 2 S ( f1 , f4 ) = 2y + 2yz + xz − xz , r = S ( f1 , f4 ) rem G = 0. 2.14. példa. Legyen F
Hasonlóan, az összes fennmaradó pár S -polinomjának G-vel vett maradékos osztásakor a mara érték G dék 0, így a visszatéro
= { x − y − z, x + y − z2 , x2 + y2 − 1, −2y − z + z2 , −1/2z4 − 1/2z2 + 1}
egy Gröbner-bázis.
2.3.5. Redukált Gröbner-bázis A Buchberger-algoritmus által eredményezett Gröbner-bázis általában nem minimális és elérheto. nem egyértelmu. Szerencsére egy kis ravaszkodással mindketto
70
2. Komputeralgebra
2.19. lemma. Ha G az I
⊆ R ideál egy Gröbner-bázisa és lt(g) ∈ hlt(G \ {g})i, akkor G \ {g}
is egy Gröbner-bázisa I-nek. Azt mondjuk, hogy a G
⊆ R halmaz ∈ G esetén
az I
= hGi
ideál minimális Gröbner-bázisa, ha
Gröbner-bázis és minden g
•
lc(g)
= 1,
•
lt(g)
< hlt(G \ {g})i.
A G Gröbner-bázis egy g az
hlt(G \ {g})i
∈
G eleme redukált a G-re nézve, ha g egyetlen monomja sincs
ideálban. Egy minimális G Gröbner-bázis redukált, ha G-re vonatkozóan
minden eleme redukált. 2.20. tétel. Minden ideálhoz egyértelmuen létezik egy redukált Gröbner-bázis.
is Gröbner-bázis. Nem nehéz megmutatni, hogy G r
0
= { x−y−z, −2y−z+z2 , −1/2z4 −1/2z2 +1} = { x − 1/2z2 − 1/2z, y − 1/2z2 − 1/2z, z4 + z2 − z}
2.15. példa. A 2.14. példát alapul véve nemcsak G, hanem G redukált Gröbner-bázis.
2.3.6. A Gröbner-bázis számítási bonyolultsága A Gröbner-bázis elmélet kialakulása óta eltelt fél évszázad sem volt elég teljesen tisztázni az algoritmus számítási bonyolultságát. A tapasztalatok azt mutatják, hogy számítási tárrobbanással állunk szemben. De most, ellentétben az euklideszi algoritmus variánsainál látott számítási tárrobbanással, a növekedés ütemét nem lehet kordában tartani. A Gröbner számítási bonyolultságot szokás az EXPSPACE-teljes osztályba bázis számításnál fellépo sorolni. Legyenek f , f1 , . . . , f s mok (≺=≺tdeg ). Ha f
∈ F[x1 , . . . , xn ] az F ∈ h f1 , f2 , . . . f s i, akkor f
olyan g1 , . . . , g s
∈
=
f1 g1
+ ··· +
test feletti legfeljebb d-ed fokú polino-
fs gs
F[x1 , . . . , xn ] polinomokra, melyek fokai
β = β(n, d) =
(2d)
2
n
-nel fe-
korlátosak. Ez a duplán exponenciális korlát lényegében elkerülhetetlen, amit számos lülrol
= Q esetben az ideál-tartalmazás probléma ilyen. Szerencsére, = 1 (a Hilbert-féle Nullstellensatz), n+1 n akkor a d = 2 esetben β = 2 , a d > 2 esetben pedig β = d . Márpedig a V ( f1 , . . . , f s ) varietás pontosan akkor üres, ha 1 ∈ h f1 , f2 , . . . f s i, vagyis a polinomegyenlet-rendszerek példa bizonyít. Sajnos, az F
el. Ha f speciális esetekben drasztikus redukció érheto
megoldhatósága PSPACE-beli probléma. Számos eredmény szól amellett, hogy bizonyos feltételek mellett az (általános) ideál-tartalmazás probléma is PSPACE-beli. Ilyen feltétel például, hogy
h f1 , f2 , . . . f s i zéró-dimenziós.
Ezen
bonyolultság
számítási
ellenére
a
Gröbner-bázis
elmélet
komoly
sikere-
ket könyvelhet el: automatikus geometriai tételbizonyítás, robotok mozgásvezérlése és polinomegyenlet-rendszerek megoldása talán a legelterjedtebb alkalmazási területek. Az alábbiakban felsoroljuk azokat az területeket, ahol az elmélet sikeresen alkalmazható.
•
Polinomegyenletek ekvivalenciája.
Két polinomhalmaz pontosan akkor generálja
ugyanazt az ideált, ha Gröbner-bázisuk megegyezik (tetszoleges monomiális rendezés mellett).
71
2.4. Szimbolikus integrálás
•
Polinomegyenletek megoldhatósága. Az fi (x1 , . . . , xn ) pontosan akkor oldható meg, ha az 1
•
= 0,
1
≤i≤
s egyenletrendszer
< h f1 , . . . , f s i .
Polinomegyenletek megoldáshalmaza végessége. Az fi (x1 , . . . , xn )
=
egyenletrendszernek pontosan akkor van véges számú megoldása, ha
0, 1 ≤ i ≤ s h f1 , . . . , f s i-ben
minden xi változóhoz van olyan polinom, hogy az adott monomiális rendezés melletti fotagja xi valamilyen hatványa.
•
Polinomegyenletek véges megoldásai száma. Legyen az fi (x1 , . . . , xn )
= 0,
1
≤
i
≤
s
egyenletrendszernek véges sok megoldása. Ekkor multiplicitással számolva a polinomegyenlet megoldásszáma azon monomok halmazának számossága, melyek nem többszörösei a
h f1 , . . . , f s i Gröbner-bázisa elemei egyetlen fotagjának sem (tetszoleges mo-
nomiális rendezés mellett).
•
Kifejezések egyszerusítése.
A legutóbbira példát is mutatunk. 2.16. példa. Legyenek a, b, c a
∈ R olyanok, hogy
+ b + c = 3,
2
a
+ b2 + c2 = 9,
3
a
+ b3 + c3 = 24 .
4 + b4 + c4 értékét. Legyenek tehát f1 = a + b + c − 3, f2 = a2 + b2 + c2 − 9 és a3 + b3 + c3 − 24 R[a, b, c] elemei, továbbá legyen ≺=≺ plex , c ≺ b ≺ a. Ekkor az h f1 , f2 , f3 i Gröbner-bázisa
Számítsuk ki a az
G 4
Így a
+ b4 + c4 rem
G
= {a + b + c − 3, b2 + c2 − 3b − 3c + bc, 1 − 3c2 + c3 } . = 69, ami a feladat megoldása.
Gyakorlatok 2.3-1. Bizonyítsuk be, hogy a
≺lex , ≺ plex , ≺grlex
és
≺tdeg
monomiális rendezések valóban
megengedettek.
≺ egy monomiális rendezés R-en, f , g ∈ R \ {0}. Lássuk be az alábbiakat: = mdeg( f ) + mdeg(g), f + g , 0, akkor mdeg( f + g) max{mdeg( f ), mdeg(g)}, ahol mdeg( f ) , mdeg(g)
2.3-2. Legyen
(a) mdeg( f g) (b) ha
esetén egyenloség teljesül.
= 2x4 y2 z − 3x4 yz2 + 4xy4 z2 − 5xy2 z4 + 6x2 y4 z − 7x2 yz4 ∈ Q[x, y, z]. ≺ plex , ≺grlex és ≺tdeg monomiális rendezések esetén, ahol mindhárom esetben z ≺ y ≺ x. (b) Mindhárom monomiális rendezés esetén határozzuk meg mdeg( f ), lc( f ), lm( f ) és
2.3-3. Legyen f
(a) Rendezzük a polinom tagjait
lt( f )-et.
2.3-4.? Bizonyítsuk be a Dickson-lemmát.
= h x2 + y − 1, xy − xi ⊆ Q[x, y] ideál Gröbner-bázisát és redukált Gröbner-bázisát a ≺=≺lex monomiális rendezés esetén, ahol y ≺ x. Határozzuk meg, hogy 2 2 2 az alábbi polinomok közül melyik eleme az ideálnak: f1 = x + y − y, f2 = 3xy − 4xy + x + 1. 2.3-5. Számítsuk ki az I
2.4. Szimbolikus integrálás A határozatlan integrálás problémája egy adott f függvényhez olyan g függvényt ta-
0
lálni, amelynek deriváltja f , azaz amelyre g (x)
=
f (x); ezen összefüggés jelölésére az
72
2. Komputeralgebra
R f (x) d x
=
analízis eloadásokon g(x) jelölést is használjuk. A bevezeto a határozatlan in-
módszerekkel próbálkozunk, amelyek között tegrálási problémák megoldására különbözo heurisztikus módon próbálunk választani: helyettesítések, trigonometrikus helyettesítések, parciális integrálás stb. Csak a racionális törtfüggvények integrálására szokás algoritmikus módszert használni. Megmutatható, hogy a határozatlan integrálás teljes általánosságban algoritmussal meg oldhatatlan probléma. Tehát csak arra van lehetoségünk, hogy minél nagyobb algoritmussal megoldható részt keressünk. lépés a probléma algebraizálása: teljesen elvonatkoztatunk minden analízisbeli Az elso fogalomtól, és a differenciálást úgy tekintjük, mint egy új (egyváltozós) algebrai muveletet, amely az összeadással és a szorzással adott kapcsolatban van, és ennek a muveletnek az inverzét keressük. Ez a felfogás vezetett a differenciálalgebra fogalmának bevezetéséhez. A komputeralgebra rendszerek (például a M) integráló rutinja, hasonlóan hozzánk, eloször néhány heurisztikus módszerrel próbálkozik. Polinomok (vagy kicsit általánosabban, véges Laurent-sorok) integrálja könnyen meghatározható. Ezután egy egyszeru táblázatban való keresés következik (a M esetén például 35 alapintegrál felhasználása). bevitt integráltáblázatokat is használni. Ezután speciális eseteket Lehet persze könyvekbol módszerek ismertek. Például kereshetünk, amelyre megfelelo e
ax+b
sin(cx
+ d) · p(x)
alakú integrálok esetén, ahol p polinom, parciális integrálás használható az integrál meghatározására. Ha a fenti módszerek sikertelenek, akkor helyettesítéssel próbálkozik az úgynevezett
beosztás a deriválttal módszer formájában: ha az integrandus összetett kifeje zés, akkor minden f (x) részkifejezésére osztunk f deriváltjával, majd kipróbáljuk, hogy
u
=
eltunik-e f (x) helyettesítés után a kapott kifejezésbol x. Ezek az egyszeru módsze-
rek meglepoen sok határozatlan integrál kiszámítására elegendoek. Nagy elonyük, hogy az egyszeru problémákat gyorsan oldják meg. Ha nem vezetnek célhoz, akkor próbálkozunk a racionális törtfüggvények integrálása. az algoritmikus módszerekkel. Ezek között az elso Mint látni fogjuk, a komputeralgebra rendszerekben használt változat lényegesen eltér a kézi még bonyolult esetekben is számolásra használt változattól, mert a cél az, hogy a futási ido legegyszerubb kicsi legyen, és az eredmény a leheto formában keletkezzen. Az elemi függvények integrálására használt Risch-algoritmus a racionális törtfüggvények integrálására használt algoritmusokon alapul. Ezt is ismertetjük, de nem tárgyaljuk teljes részletességgel. A bizonyításokra inkább csak utalunk.
2.4.1. Racionális függvények integrálása Ebben a pontban bevezetjük a differenciáltest és a differenciáltest bovítésének fogalmát, majd ismertetjük Hermite módszerét. Differenciáltest Legyen K egy nulla karakterisztikájú test, amelyen adott egy f önmagába az alábbi két tulajdonsággal: (1) ( f
+ g)0 =
(2) ( f g)
0
=
0
f
f g
0
+ g0
+ g0 f
(additivitás); (Leibniz-szabály).
7→
f
0
leképezése K-nak
73
2.4. Szimbolikus integrálás
7→ f 0 leképezést differenciáloperátornak, differenciálásnak vagy deriválásnak, 0 K-t pedig differenciáltestnek nevezzük. A C = {c ∈ K : cR = 0} halmaz a konstansok 0 részteste K-ban. Ha f = g, akkor azt is írjuk, hogy f = g. Nyilván bármely c ∈ C R 0 konstansra f + c = g. Egy 0 , f ∈ K elem logaritmikus deriváltján f / f -et értjük.
Ekkor az f
(Formálisan ez
log( f ) deriváltja.)
2.21. tétel. Az eloz o deníció jelöléseivel, a deriválás szokásos tulajdonságai teljesülnek:
0
(1) 0
= 10 = (−1)0 = 0;
(2) a differenciálás C-lineáris: (a f (3) ha g
(5)
f tetszoleges, akkor ( f /g)
0
K, a, b
∈ C;
= ( f 0 g − g0 f )/g2 ;
= n f 0 f n−1 , ha 0 , f ∈ K és n ∈ Z; R 0 0 fg = fg − g f , ha f , g ∈ K (parciális integrálás).
n
(4) ( f )
R
, 0,
+ bg)0 = a f 0 + bg0 , ha f , g ∈
0
2.17. példa.
7→ 0 leképezés K-n a triviális deriválás, erre C = K. = Q(x). Egyetlen olyan differenciálás van Q(x)-en, a szokásos, amelyre x0 = 1. Q elemei. Valóban, indukcióval n0 = 0, ha n ∈ N, és így Z illetve Q elemei is
o deníció jelöléseivel, az f (1) Az eloz (2) Legyen K Erre a konstansok
konstansok. Indukcióval adódik, hogy a hatványfüggvények deriváltja a szokásos, ahonnan a linearitás miatt a polinomoké is, így a hányados differenciálási szabálya szerint kapjuk az állítást. Nem nehéz kiszámolni, hogy a szokásos differenciálásra a konstansok
Q elemei.
C(x), ahol C tetszoleges nulla karakterisztikájú test, akkor egyetlen olyan differen0 ciálás van K-n, a szokásos, amelyre a konstansok részteste C és x = 1; az állítás hasonlóan adódik, (3) Ha K
=
o. mint az eloz
Ha C tetszoleges nulla karakterisztikájú test és K
=
C(x) a szokásos differenciálással,
akkor 1/ x nem deriváltja semminek. (Az állítás bizonyítása nagyon hasonlít annak bizonyí-
√
tásához, hogy
2 irracionális, de kettovel való oszthatóság helyett az x polinommal való
oszthatósággal kell dolgoznunk.) A példa azt mutatja, hogy 1/ x és más hasonló függvények integrálásához a differenci áltestet bovíteni kell. A racionális törtfüggvények integrálásához elég lesz logaritmusokkal bovíteni. Differenciáltest bovítése Legyen L egy differenciáltest, K
⊂
L pedig egy részteste L-nek. Ha a differenciálás nem
vezet ki K-ból, akkor azt mondjuk, hogy K egy differenciálrészteste L-nek, illetve hogy L egy differenciálbovítése K-nak. Ha valamely f , g
∈
a g logaritmikus R deriváltja, akkor azt írjuk, hogy f ugyanúgy, mint
L-re f
=
0
=
g
0
/g,
azaz ha f deriváltja
log g. (Megjegyezzük, hogy log,
, nem függvény, hanem reláció. Más szóval a log itt egy absztrakt fogalom,
nem pedig egy meghatározott alapú logaritmus függvény.) Ha g
∈
K választható, akkor azt
mondjuk, hogy f logaritmikus K felett. 2.18. példa.
∈RK = Q(x), L = Q(x, = log(x). Ekkor 1/ x d x = log(x).
(1) Legyen g azaz f
=
x
f ), ahol f egy új határozatlan, és legyen f
0
= g0 /g = 1/ x,
74
2. Komputeralgebra
(2) Hasonlóan,
a
Q(
√
2) x, log(x
−
√
Z √
1
2
=
log(x
√
√
−
2
−
2)
−2 4 4 √ 2), log(x + 2) differenciáltestben van. x
2
log(x
+
√ 2)
(3) Mivel
Z
1 x3
+x
= log(x) −
1 2
log(x
1
+ i) −
− i) = log(x) −
log(x
2
az integrál tekintheto
Q x, log(x), log(x2 + 1)
1 2
log(x
2
+ 1) ,
elemének is és
Q(i) x, log(x), log(x − i), log(x + i)
lehetoséget elemének is. Nyilván célszerubb az elso választani, mert ekkor az alaptest bovítésére nincs szükség.
Hermite módszere Legyen R K egy nulla karakterisztikájú test, f , g Az
∈
K[x] nemnulla és relatív prím polinomok.
f /g integrál kiszámításához Hermite módszerével olyan a, b, c, d
Z
találhatunk, amelyekre
f
ahol deg a
<
c
=
g
Z
a
+
d
b
∈
K[x] polinomokat
,
(2.15)
deg b és bRnégyzetmentes fopolinom. A c/d racionális függvényt az integrál a/b kifejezést pedig az integrál logaritmikus részének nevezzük.
racionális részének, az
A módszer elkerüli g-nek a (felbontási testben vagy valamely még bovebb testben) lineáris még a K felett irreducibilis tényezokre tényezokre való bontását, sot, való felbontást is. Nyilván feltehetjük, hogy g fopolinom. Maradékos osztással f deg g, így f /g
=
p
+ h/g.
=
pg
+ h, ahol deg h <
A p polinomrész integrálása triviális. Határozzuk meg g négy-
zetmentes felbontását, azaz keressünk olyan g1 , . . . , gm relatív prím fopolinomokat, amelyekre gm
,
1 és g
∈
=
K[x] négyzetmentes és páronként 2
g1 g2
· · · gm . m
Bontsunk parciális tör-
tekre (ez euklideszi algoritmussal megvalósítható): h
m X i X hi, j
=
g
i=1
j
,
gi
j=1
ahol minden hi, j foka kisebb, mint gi foka. lépés ismétlése: ha j A Hermite-redukció a következo
>
R 1, akkor az
j
hi, j /gi integ-
rált egy racionális függvény és egy, az eredetihez hasonló alakú integrál összegére redukáljuk, amelyben j eggyel kisebb. Felhasználva, hogy gi négyzetmentes, azt kapjuk, hogy
0
lnko(gi , gi )
= 1, így a bovített euklidészi algoritmussal kaphatunk olyan s, t ∈ K[x] polino+ tg0i = hi, j és deg s, deg t < deg gi . Innen parciális integrálással
mokat, amelyekre sgi
Z
hi, j j
Z =
t
Z
· g0i
+
j
gi
gi
gi Z
−t
= (j
s j− 1
j−1
− 1)gi
t
+ (j
Z
0 j−1
− 1)gi
+
s j−1
gi
75
2.4. Szimbolikus integrálás
Z
−t
= (j
− 1)gij−1
+
s
+ t0 /( j − 1) j−1
.
gi
Megmutatható, hogy gyors algoritmusokat választva, ha deg f , deg g járás O M(n) log n
<
n, akkor az el-
darab K testbeli muveletet igényel, ahol M(n) a legfeljebb n-ed fokú
polinomok szorzásához szükséges muveletek számának korlátja. Hermite módszerének van olyan változata is, amely elkerüli h/g parciális törtekre bontását. Ha m
= 1, akkor g négyzetmentes. Ha m > 1, akkor legyen ∗
g
∗ 0
Mivel lnko(gm , g gm )
−1 = g1 g22 · · · gm = m−1
= 1, léteznek olyan s, t ∈ sgm
+
g m
gm
.
K[x] polinomok, amelyekre
∗ 0 tg gm
=h.
= g∗ gm -el és parciálisan integrálva m Z Z ∗ 0 h −t s + g t /(m − 1) = + , m−1 m−1 g (m − 1)gm g∗ gm
Mindkét oldalt osztva g
így m-et eggyel csökkentettük. Megjegyezzük, hogy a és c a határozatlan együtthatók módszerével is meghatározhatók (Horowitz módszere). Osztás után feltehetjük, hogy deg f látszik, d
=
2
g2 g3
−1 · · · gm m
és b
=
g1 g2
· · · gm
<
deg g. Mint az algoritmusból
választható. (2.15) differenciálásával az a poli-
nom deg b darab és a c polinom deg d darab együtthatójára, tehát összesen n darab együtthatóra egy lineáris egyenletrendszert kapunk. Ez a módszer általában nem olyan gyors, mint Hermite módszere. Az alábbi algoritmus az x változó adott f /g racionális függvényére elvégzi a Hermiteredukciót. H- ´ ( f , g)
17
← quo( f , g) ← rem( f , g) (g[1], . . . , g[m]) ← N´ (g) j bontsuk (h/g)-t parciális törtekre, számítsuk ki a g[i] -hez tartozó h[i, j] számlálókat rac ← 0 int ← 0 for i ← 1 to m do int ← int + h[i, 1]/g[i] for j ← 2 to i do n ← j while n > 1 0 do s és t meghatározása az s · g[i] + t · g[i] = h[i, j] egyenletbol n ← n−1 n rac ← rac − (t/n)/g[i] 0 h[i, n] ← s + t /n int ← int + h[i, 1]/g[i] R R red ← rac + p+ int
18
return red
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
p
h
76
2. Komputeralgebra
R Ha valamely nulla karakterisztikájú K testre az ahol a, b
∈
a/b integrált akarjuk kiszámítani,
K[x] nem nulla relatív prím polinomok, deg a
<
deg b, b négyzetmentes
és fopolinom, akkor eljárhatunk úgy, hogy a b polinom L felbontási testében felírjuk b-t
Qn
alakban: b gyöktényezos
=
a/b
végül integrálunk:
=
Pn
c /(x− k=1 k
Z
a
n X
k ),
k=1
ck log(x−
(x−
←
k ),
majd L felett parciális törtekre bontunk:
L x, log(x−
←
k)
∈
Ennek az eljárásnak, mint az 1/(x
+
x) függvény példáján láttuk, a hátránya, hogy az L
1)
, . . . , log(x− ←
←
b
=
←
n)
.
k=1 3
testbovítés foka túl magas lehet. Elofordulhat az is, hogy L foka K felett n!, ami teljesen kezelhetetlen esetekhez vezet. Másrészt az sem világos, hogy kell-e az adott esetben az alaptestet bovíteni, például az 1/(x
2
− 2)
függvény esetében nem lehet-e az integrálást az
tétel lehetové alaptest bovítése nélkül elvégezni. A következo teszi, hogy L testbovítés fokát legkisebbre válasszuk. a leheto 2.22. tétel (RothsteinTrager-féle integráló algoritmus). test, a, b
∈
Legyen K nulla karakterisztikájú
K[x] nem nulla relatív prím polinomok, deg a
és fopolinom. Ha L algebrai bovítése K-nak, c1 , . . . , ck v1 , . . . , vk
∈
L[x]
\
∈
L
< \
deg b, b négyzetmentes K páronként különbözo,
L pedig négyzetmentes és páronként relatív prím fopolinomok, akkor
az alábbiak ekvivalensek:
Z
a
(1)
b
(2) Az r
=
res x (b, a
− yb0 ) ∈
=
k X
ci log vi
,
i= 1
K[y] polinom L felett lineáris tényezokre bomlik, c1 , . . . , ck
pontosan az r különbözo gyökei, és vi
=
lnko(b, a
−
0
ci b ), ha i
=
1, . . . , k. Itt res x az x
határozatlanban vett rezultáns.
R
+ x) d x integrál kiszámításának problémáját. Ebben az esetben 3 2 3 2 x + x, 1 − y(3x + 1) = −4z + 3y + 1 = −(2y + 1) (y − 1) ,
2.19. példa. Tekintsük ismét az r
= res x
amelynek gyökei c1
1/(x
3
= 1 és c2 = −1/2. Így + x, 1 − (3x2 + 1) = x , 1 3 2 2 x + x, 1 + (3x + 1) = x + 1 .
v1
=
lnko x
v2
=
lnko
3
2
o tétel alapján könnyen felírható integráló algoritmus kicsit javítható: vi Az eloz lnko(b, a
−
=
0
kiszámítása helyett vi megci b )-nek (az L test feletti számításokkal történo)
kapható K feletti számítással is, a B algoritmus segítségével. ´-E- ´ Ezt egymástól függetlenül Trager, illetve Lazard és Rioboo vette észre. Nem nehéz belátni,
hogy az így adódó teljes integráló algoritmus futásideje O nM(n) lg n , ha deg f , deg g 2.23. tétel (LazardRiobooTrager-formula). mint az r
< n.
Az eloz o tétel jelöléseivel, jelölje e a ci -nek
= res x (b, a − yb0 ) polinom gyökének a multiplicitását. Ekkor
77
2.4. Szimbolikus integrálás
(1) deg vi
= e;
∈ K(y)[x] jelöli a b-re és a − yb0 -re K(y)[x]-ben végrehajtott E- ´ -algoritmus e-ed fokú maradékát, akkor vi = w(x, ci ).
(2) ha w(x, y)
B ´-
Az alábbi algoritmus a RothsteinTrager-módszer LazardRiobooTrager-féle javítása. R
Az x változó adott a/b racionális függvényére kiszámítjuk fopolinom és deg a
a/b-t, ahol b négyzetmentes
< deg b.
L- ´ - ´ (a, b, x)
← res x (b, a − yb0 ), továbbá
1
a szubrezultáns algoritmussal legyen r(y)
2
a számítás során legyen we (x, y) az e-ed fokú maradék
3
(r1 (y), . . . , rk (y))
4
int
5
←0 for i ← 1 to k
6
do if ri (y)
7
,1 ← wi (x, y) együtthatóinak lnko-ja ←B ´-E- ´ (w(y), ri (y)) wi (x, y) ←P´- ´ (rem(s(y) · wi (x, y), ri (y))) (ri,1 , . . . , ri,k ) ←F(ri ) for j ← 1 to k do d ← deg(ri, j ) c ←M ´ (ri, j (y) = 0, y) if d = 1 then int ← int + c · log(wi (x, c)) else for n ← 1 to d do int ← int + c[n] · log(wi (x, c[n]))
then w(y)
(l(y), s(y), t(y))
8 9 10 11 12 13 14 15 16 17 18
←N´(r(y))
return int
R 2.20. példa. Tekintsük ismét az r
1/(x
2
− 2) d x integrál kiszámításának problémáját. Ebben az esetben
= res x (x2 − 2, 1 − y · 2x) = −8y2 + 1 .
√ Q[x]-ben, így Q bovítése elkerülhetetlen. Az r gyökei ±1/ 8. A Q(y) feletti B ´-E- ´ -algoritmusból w1 (x, y) = x − 1/(2y), így az integrál Z √ √ 1 1 1 2) − √ log(x + 2) . d x = √ log(x − 2 x −2 8 8
A polinom irreducibilis
2.4.2. Risch integráló algoritmusa módon, a racionális függvények integrálására talált módszerek általánosíthatók a Meglepo szokásos függvényeket (sin, exp stb.) és inverzeiket tartalmazó kifejezések integrálására. A komputeralgebra rendszerek meglepoen bonyolult kifejezések integrálását is elvégzik, néha azonban látszólag igen egyszeru esetekben sem adják meg az integrált, például az
78 R
2. Komputeralgebra
x/(1
+ e x ) d x kifejezést kiértékeletlenül kapjuk vissza, vagy az eredmény nem elemi spe-
ciális függvényt tartalmaz, például az integrállogaritmus függvényt. Ez azért van, mert ezek ki ben az esetekben az integrál nem is fejezheto
zárt alakban. integrálokra vonatkozó alapveto eredményt Liouville zárt alakban kifejezheto algoritmikus módszereket Risch csak 1968-ban fejlesztette ki. 1833-ban találta, a megfelelo Bár a
Elemi függvények A
zárt alakban megadható függvényeknek azokat a függvényeket szokás tekinteni, ame a racionális függvények, az exponenciális és logaritmus függvény, a trigolyek felépíthetok nometrikus és hiperbolikus függvények és inverzeik, valamint gyökvonások, illetve sokkal általánosabban polinom függvények inverzei, azaz egyenletek gyökeinek képzése segít ségével, tehát ezen függvények egymásba helyettesítésével. R 1/(1
Észrevehetjük, hogy míg az
+ x2 ) d x integrált arctg(x) alakban szokás megadni,
a racionális törtfüggvény integrálására megadott algoritmus az eredményt
Z
1 1
alakban adja. Mivel
C-ben
+x
2
dx
=
i 2
log(x
+ i) −
i 2
log(x
− i)
az a trigonometrikus és hiperbolikus függvények kifejezhetok
exponenciális függvény, inverzeik pedig a logaritmus függvény segítségével, csak az ex módon kiderül, hogy az ponenciális és a logaritmus függvényre szorítkozhatunk. Meglepo integrálok kifejezéséhez (algebrai számokkal való bovítések mellett) itt is csak logaritmu sokkal való bovítésekre van szükség. Exponenciális elemek Legyen L a K differenciáltest differenciálbovítése. Ha egy hogy
θ0 /θ =
0
u , azaz ha
azt mondjuk, hogy hogy a
θ∈
θ
θ
θ∈
L elemhez van olyan u
∈
K,
logaritmikus deriváltja K valamely elemének a deriváltja, akkor
θ = exp(u). Ha csak az teljesül, θ0 /θ = u, azaz, ha θ logaritmikus deriváltja K
exponenciális K felett, és azt írjuk
L elemhez van olyan u
eleme, akkor azt mondjuk, hogy
∈
K, hogy
θ hiperexponenciális K
felett.
A K felett logaritmikus, exponenciális vagy hiperexponenciális elemek lehetnek algebraiak vagy transzcendensek K felett. Elemi kiterjesztések Legyen L a K differenciáltest differenciálbovítése. Ha L ahol j
= 1, 2, . . . , n-re θ j
=
K(θ1 , θ2 , . . . , θn )
,
logaritmikus, exponenciális vagy algebrai K j− 1
=
K(θ1 , . . . , θ j−1 )
felett (K0 = K), akkor azt mondjuk, hogy L a K elemi kiterjesztése. Ha j = 1, 2, . . . , n-re θ j transzcendens és logaritmikus vagy transzcendens és exponenciális K j−1 felett, akkor azt mondjuk, hogy L a K transzcendens elemi kiterjesztése. Legyen C(x) a racionális függvények teste C C konstans testtel és a szokásos differenciálással. Ennek egy elemi kiterjesztését elemi függvénytestnek, transzcendens elemi kiterjesztését pedig transzcendens elemi függvénytestnek nevezzük.
79
2.4. Szimbolikus integrálás
= exp(x) + exp(2x) + exp(x/2) függvény f = θ1 + θ2 + θ3 ∈ Q(x, θ1 , θ2 , θ3 ) alakban θ1 = exp(x), θ2 = exp(2x), θ3 = exp(x/2). Nyilván θ1 exponenciális Q(x) felett, θ2 2 exponenciális Q(x, θ1 ) felett és θ3 exponenciális Q(x, θ1 , θ2 ) felett. Mivel θ2 = θ1 , Q(x, θ1 , θ2 ) = Q(θ1 ), 2 így f az egyszerubb f = θ1 + θ1 + θ3 alakba írható. A θ3 függvény nemcsak exponenciális Q(x, θ1 ) 1/2 1/2 1/2 2 2 felett, hanem algebrai is, mivel θ3 − θ1 = 0, azaz θ3 = θ1 . Így f = θ1 + θ1 + θ1 ∈ Q(x, θ1 , θ1 ). De f
2.21. példa. Az f írható, ahol
még ennél egyszerubb alakban is felírható: f
2.22. példa. Az
= θ32 + θ34 + θ3 ∈ Q(x, θ3 ) .
q f
=
log(x2
+ 3x + 2)
log(x
+ 1) + log(x + 2)
2 függvény felírható f = θ4 ∈ Q(x, θ1 , θ2 , θ3 , θ4 ) alakban, ahol θ1 = log(x + 3x + 1), θ2 = log(x + 1), θ3 = log(x + 2), θ4 pedig a θ42 −θ1 (θ2 +θ3 ) = 0 algebrai egyenletnek tesz eleget, de sokkal egyszerubben f = θ1 ∈ Q(x, θ1 ) alakban is.
2.23. példa. Az f
=
exp log(x)/2 függvény felírható f
θ2 = exp(θ1 /2), így θ1 logaritmikus Q(x) felett, θ2 θ22 − x = 0, így θ2 algebrai Q(x) felett, és f (x) = x1/2 .
és
= θ2 ∈ Q(x, θ1 , θ2 ) alakban, ahol θ1 = log(x) Q(x, θ1 ) felett. Azonban
pedig exponenciális
Elemi függvények integrálása Tetszoleges elemi függvénytestek elemeinek integrálját, ha elemi függvény, a Liouville-elv teljesen jellemezni fogja. Mindazonáltal az algebrai kiterjesztési lépések ha nem csak a konstansok testét terjesztjük ki nagy nehézségeket okoznak. Itt csak a transzcendens elemi függvénytestek függvényeinek Risch-algoritmussal tör integrálásával foglalkozunk. téno A gyakorlatban egy
Q(α1 , . . . , αk )(x, θ1 , . . . , θn ) transzcendens elemi függvénytest valaα1 , . . . , αk algebrai számok Q felett, az integrál pedig egy
van szó, ahol mely elemérol
Q(α1 , . . . , αk , . . . , αk+h )(x, θ1 , . . . , θn , . . . , θn+m ) elemi függvénytest eleme lesz. Elvileg legegyszerubb lenne a konstansok testét
C-nek vá-
lasztani, de mint a racionális függvények integrálásánál láttuk, ez nem lehetséges, mert csak bizonyos számtestekben, például algebrai számtestekben tudunk pontosan számolni, sot, igyekeznünk kell az
αk+1 , . . . , αk+h
legalacsoalgebrai számok számát és fokaikat a leheto
nyabban tartani. Mindazonáltal a konstansok testének algebrai bovítéseit kezelhetjük dina elképzelhetjük, hogy már elore mikusan, a szükségessé váló bovítésekr ol elvégeztük oket, a gyakorlatban pedig mindig csak akkor hajtjuk végre a bovítést, ha szükségessé válik. Miután a trigonometrikus és hiperbolikus függvények exponenciálisra, inverzeiknek pedig logaritmusra való konverzióját elvégeztük, az integrandust mint egy elemi függvénytest elemét kapjuk meg. A 2.21. és 2.22. példák mutatják, hogy bár lehet, hogy a függvény elso pillantásra nem tunik egy transzcendens elemi kiterjesztés elemének, mégis az, a 2.23. pillantásra transzcendens elemi kiterelso lépés tehát az, hogy a különbözo exponenciális jesztés elemének tunik, mégsem az. Az elso példa pedig azt, hogy lehet, hogy a függvény
80
2. Komputeralgebra
és logaritmikus függvények közötti algebrai kapcsolatok vizsgálatával az integrandust mint Hogy ez hogyan lehetséges, azzal nem transzcendens elemi függvénytest elemét állítjuk elo. a Risch-tol származó struktúra-tétel sefoglalkozunk. Hogy ez sikerült-e, az ellenorizhet o gítségével. A tétel bizonyítását elhagytuk. Szükségünk lesz egy denícióra. Egy
θ elem monomiális a K
differenciáltest felett, ha transzcendens K felett, exponen-
ciális vagy logaritmikus K felett, valamint K-ban és K(θ)-ban ugyanazok a konstansok. 2.24. tétel (struktúra-tétel). Legyen K a konstansok teste és Kn
=
K(x, θ1 , . . . , θn ) egy
differenciál-kiterjesztése K(x)-nek, amelyben a konstansok teste K. Tegyük fel, hogy minden uj
θj
∈
1.
g
= K(x, θ1 , . . . , θ j−1 ) felett, vagy θ j = θ j = u j , ahol u j = exp(w j ) és w j ∈ K j−1 . Ekkor
vagy algebrai K j−1
K j−1 , vagy
= log( f ), ahol
f
∈
Kn
\ K, pontosan akkor monomiális Kn Y k k f · k, k j ∈ Z, k , 0 uj ,
w j , ahol w j
=
log(u j ) és
felett, ha nincs olyan
j
szorzat, amely K-beli; 2.
g
= exp( f ), ahol
f
∈
Kn
\ K, pontosan akkor monomiális Kn felett, ha nincs olyan X f + c jw j, cj ∈ Q
lineáris kombináció, amely K-beli. A szorzatképzés, illetve összegzés csak a logaritmikus és exponenciális lépésekre történik. tétel. Az egész elmélet legfontosabb, klasszikus eredménye a következo 2.25. tétel (Liouville-elv). Legyen K egy differenciáltest a C konstans testtel. Legyen L egy
0
elemi differenciálkiterjesztése K-nak ugyanazzal a C konstans testtel. Tegyük fel, hogy g f
∈
K. Ekkor léteznek olyan c1 , . . . , cm
f
∈ C konstansok és v0 , v1 , . . . , vm ∈
= v00 +
m X
0
cj j= 1
azaz hogy
Z g
=
f
= v0 +
=
K elemek, hogy
vj vj
,
m X
c j log(v j )
.
j=1
Figyeljük meg, hogy a helyzet hasonló, mint a racionális függvények integrálásánál. A tételt nem bizonyítjuk. Bár a bizonyítás hosszadalmas, az ötlete könnyen elmondható. Eloször megmutatjuk, hogy egy transzcendens exponenciális bovítést differenciálással nem lehet
kiküszöbölni, azaz egy racionális függvényét deriválva, abból az új elem nem tunik elem egy polinomját deriel. Ez azon múlik, hogy a transzcendens exponenciális bovít o válva, a derivált újra az elem egy polinomja lesz, a polinom foka nem változik, és a derivált nem osztható az eredeti polinommal, kivéve, ha az monom volt. Utána megmutatjuk, hogy algebrai bovítésre nincs szükség az integrál kifejezéséhez. Ez lényegében azon múlik, hogy elemet a minimálpolinomjába beírva nullát kapunk, és ezt az egyenleaz algebrai bovít o kifejezheto a bovít elem deriváltja, mint az elem tet differenciálva, a kapott egyenletbol o
81
2.4. Szimbolikus integrálás
racionális függvénye. Végül a transzcendens logaritmikus elemekkel való bovítéseket kell elem differenciálással pontosan még megvizsgálnunk. Megmutatjuk, hogy egy ilyen bovít o ki, ha egy konstans együtthatós elsofokú akkor küszöbölheto polinomja szerepel. Ez azon elem egy polinomját deriválva, annak egy polinomját kapjuk, múlik, hogy egy ilyen bovít o aminek fokszáma vagy ugyanannyi, mint az eredetié, vagy eggyel kisebb, és ez utóbbi eset ha a foegyüttható csak akkor fordulhat elo, konstans. Risch-algoritmus
Q felett, Kn = K(x, θ1 , . . . , θn ) pedig transzcendens elemi függθ = θn jelöléssel egy f (θ)/g(θ) ∈ Kn = Kn−1 (θ) integrálni, ahol Kn−1 = K(x, θ1 , . . . , θn−1 ). (Az n = 0 eset a racionális
Legyen K algebrai számtest
vénytest. Az algoritmus rekurzív n-ben: függvényt fogunk
függvények integrálása.) Feltehetjük, hogy f és g relatív prímek és g fopolinom. Az x szerinti differenciálás mellett használni fogjuk a
θ
szerinti deriválást is, ezt d /d θ-val jelöljük.
A továbbiakban csak az algoritmusokat ismertetjük. Risch-algoritmus: logaritmikus eset
θ transzcendens u /u, u ∈ Kn−1 . Maradékos osztással f (θ) = p(θ)g(θ) + h(θ), ahonnan Z Z Z f (θ ) h(θ) = p(θ) + . g(θ) g(θ) o pont jelöléseivel, eloször Az eloz feltesszük, hogy
és logaritmikus,
θ0 =
0
A racionális függvények integrálásával ellentétben, most a polinomrész integrálása a nehezebb. Ezért a racionális rész integrálásával kezdjük.
Logaritmikus eset, racionális rész Legyen g(θ)
= g1 (θ)g22 (θ) · · · gm (θ) a g(θ) négyzetmentes felbontása. Ekkor m ! d lnko (g j (θ), g j (θ ) ) = 1 dθ 0 nyilván teljesül. Megmutatható, hogy a jóval erosebb lnko g j (θ), g j (θ) = 1 feltétel is telje-
sül. Parciális törtekre bontással h(θ) g(θ)
=
m X i X hi, j (θ) i= 1
j= 1
gi (θ) j
.
Hermite-redukciót fogunk használni: a bovített euklidészi algoritmussal kaphatunk olyan s(θ), t(θ)
∈
Kn−1 [θ]
deg s(θ), deg t(θ)
Z
polinomokat,
amelyekre
s(θ)gi (θ)
+
t(θ)gi (θ)
0
=
< deg gi (θ). Innen parciális integrálással
hi, j (θ) j
gi (θ)
Z = = =
Z · gi (θ)0 + gi (θ) j Z −t(θ) + ( j − 1)gi (θ) j−1 Z −t(θ) + ( j − 1)gi (θ) j−1 t(θ)
s(θ) gi (θ) j−1
Z
0
t(θ)
j−1
( j − 1)gi (θ) 0 s(θ) + t(θ) /( j gi (θ) j−1
s(θ)
+ − 1)
gi (θ) j−1
.
hi, j (θ)
és
82
2. Komputeralgebra
> 1, azt kapjuk, hogy Z h(θ) c(θ) a(θ) = + , g(θ) d(θ) b(θ)
Addig alkalmazva ezt az eljárást, amíg j
Z
ahol a(θ), b(θ), c(θ), d(θ)
∈ KRn−1 [θ], deg a(θ) < deg b(θ) és b(θ) négyzetmentes fopolinom. a(θ)/b(θ) integrál kiszámítására a RothsteinTrager-módszer
Megmutatható, hogy az
alkalmazható. Számítsuk ki az r(y)
= resθ
− y · b(θ)0
b(θ), a(θ)
rezultánst. Megmutatható, hogy az integrál pontosan akkor elemi, ha r(y) írható, ahol r(y)
∈
K[y] és s
∈
=
r(y)s alakban
Kn−1 . Ha tehát kiszámítjuk r(y) primitív részét, ezt választjuk
r(y)-nak, és r(y) bármelyik együtthatója nem konstans, akkor nem létezik elemi integrál. gyökei annak felbontási testében és legyen Egyébként legyenek c1 , . . . , ck az r(y) különbözo vi (θ) ha i
= lnko
b(θ), a(θ)
− ci b(θ)0 ∈
Kn−1 (c1 , . . . , ck )[θ]
,
= 1, . . . , k. Megmutatható, hogy Z
a(θ) b(θ)
=
k X
ci log vi (θ)
.
i=1
Tekintsünk néhány példát.
R 2.24. példa. Az
1/ log(x) integrál integrandusa 1/θ r(y)
∈ Q(x, θ), ahol θ = log(x)
. Mivel
= resθ (θ, 1 − y/ x) = 1 − y/ x ∈ Q(x)[y]
primitív polinom és van nem konstans együtthatója, az integrál nem elemi.
R 2.25. példa. Az
1/ x log(x) integrál integrandusa 1/(xθ) r(y)
= resθ (θ, 1/ x − y/ x) = 1/ x − y/ x ∈ Q(x)[y],
− y. Ennek = lnko(θ, 1/ x − 1/ x) = θ, így Z
aminek primitív része 1 v1 ( θ )
∈ Q(x, θ), ahol θ = log(x) . Itt
minden együtthatója konstans, így az integrál elemi, c1
1
x log(x)
= c1 log
v1 (θ)
= log
log(x)
=
1,
.
Logaritmikus eset, polinom rész Marad a p(θ)
=
pk θ
k
+ pk−1 θk−1 + · · · + p0 ∈
Kn−1 [θ]
polinomrész integrálásának problémája. A Liouville-elv szerint elemi, ha p(θ)
= v0 (θ)0 +
k X
cj j=1
v j (θ )
0
v j (θ )
,
R
p(θ) pontosan akkor
83
2.4. Szimbolikus integrálás
ahol c j
∈
K és vi
∈
Kn−1 (θ), ha j
= 0, 1, . . . , m, továbbá KC a K valamely bovítése és Kn−1 =
K(x, θ1 , . . . , θn−1 ). Meg fogjuk mutatni, hogy K lehet a K egy algebrai bovítése. Hasonlóan érvelve, mint a Liouville-elv bizonyításában, megmutatható, hogy v0 (θ) Kn−1 (azaz független
∈
Kn−1 [θ] és v j (θ)
∈
θ-tól), ha j = 1, 2, . . . , m. Így = v0 (θ)0 +
p(θ)
m X
0
cj j=1
vj vj
.
A Liouville-elv bizonyításánál használt érveléssel azt is megkapjuk, hogy v0 (θ) foka legfeljebb k
+ 1. így ha v0 (θ) = qk+1 θk+1 + qk θk + · · · + q0 , akkor pk θ
k
+ pk−1 θk−1 + · · · + p0 = (qk+1 θk+1 + qk θk + · · · + q0 )0 +
0
m X
cj j=1
vj vj
.
egyenletrendszert kapjuk: Innen a következo
= = = .. .
0 pk pk−1
= =
p1 p0 ahol az utolsó egyenletben q0
=
q0
0
, + 1)qk+1 θ0 + q0k , 0 0 kqk θ + qk−1 , qk+1 (k
+ q01 , 0 q1 θ + q0 , 2q2 θ
Pm
+
0
0
j= 1
egyenlet megoldása egyszec j log(v j ). Az elso
egyenletbe és mindkét oldalt ruen egy bk+1 konstans. Ezt visszahelyettesítve a következo integrálva azt kapjuk, hogy
Z pk
= (k + 1)bk+1 · θ + qk .
Az integrálási eljárást rekurzív módon alkalmazva pk
∈
Kn−1 integrálja kiszámítható, azon-
ban ez az egyenlet csak akkor oldható meg, ha az integrál elemi, és legfeljebb R egy loga-
θ = log(u). Ha ez nem teljesül, akkor p(θ) nem = ck θ + dk valamely ck ∈ K és dk ∈ Kn−1 -el, ahon = dk + bk egy tetszoleges bk integrációs konstanssal.
ritmikus bovítést használ és az éppen
R
lehet elemi. Ha ez teljesül, akkor nan bk+1
=
ck+1 /(k
+ 1) ∈
pk
K és qk
egyenletbe és átrendezve Behelyettesítve qk -t a következo pk−1
− kdk θ0 = kbk θ0 + q0k−1 ,
vagyis mindkét oldalt integrálva
Z pk−1
− kdk
0
u
u
= kbk θ + qk−1
adódik. A jobb oldalon az integrandus Kn−1 -beli, így az integrációs eljárást rekurzív módon hívhatjuk. Ugyanúgy mint fent, az egyenlet csak akkor oldható meg, ha az integrál elemi, és legfeljebb egy logaritmikus bovítést használ és az éppen
θ = log(u). Tegyük fel, hogy ez
84
2. Komputeralgebra
teljesül és
Z pk−1
0
u
− kdk
u
= ck−1 θ + dk−1 ,
∈ K és dk−1 ∈ Kn−1 . Ekkor a keresett megoldás bk = ck−1 /k ∈ K és qk−1 = + bk−1 , ahol bk−1 egy tetszoleges integrációs konstans. Az eljárást folytatva, az utolsó elotti egyenlet megoldása b2 = c1 /2 ∈ K és q1 = d1 + b1 valamely b1 integrációs konstanssal.
ahol ck−1 dk−1
Behelyettesítve q1 -et az utolsó egyenletbe, átrendezve, majd integrálva
Z
p0
0
u
− d1
u
= b1 θ + q0 .
Ez alkalommal csak az a feltétel, hogy az integrál elemi függvény legyen. Ha elemi függvény, mondjuk
Z p0
akkor b1
∈
− d1
0
u
u
= d0 ∈
Kn−1
,
θ = log(u) együtthatója d0 -ban és q0 = d0 − b1 log(u), az eredmény pedig Z k +1 p(θ) = bk+1 θ + qk θk + · · · + q1 θ + q0 .
K a
Nézzünk néhány példát.
R 2.26. példa.
Az
log(x) integrál integrandusa
θ ∈ Q(x, θ),
ahol
θ =
log(x). Ha az integrál elemi,
Z
akkor
θ = b2 θ2 + q1 θ + q0 0 0 0 = b02 , 1 = 2b2 θ0 + R q1 , 0 = q1 θ + q0 . Az ismeretlen b2 konstanssal a második egyenletbol 1 = 2b2 θ + q1 . Mivel 1 = x + b1 , azt kapjuk, hogy b2 = 0, q1 = x + b1 . A harmadik egyenletbol R R − xθ0 = b1 θ0 +R q00 . Mivel θ0 = 1/ x, integrálva −1 = b1 θ + q0 , és −1 = − x, azt kapjuk, hogy b1 = 0, q0 = − x, így log(x) = x log(x) − x. és 0
R
R 2.27. példa. Az
log log(x) integrál integrandusa
Ha az integrál elemi, akkor
θ2 ∈ Q(x, θ1 , θ2 ), ahol θ1 = log(x) és θ2 = log(θ1 ).
Z θ2 = b2 θ22 + q1 θ2 + q0
= b02 , 1 = 2b2 θ20 R+ q01 , 0 = q1 θ20 + q00 . Az ismeretlen b2 konstanssal a második egyenletbol = 2b2 θ + q1 . Mivel 1 = x + b1 , azt kapjuk, hogy b2 = 0, q1 = x + b1 . A harmadik egyenletbol − xθ20 = b1 θ20 + q00 . Mivel θ20 = θ10 /θ1 = 1/ x log(x) , teljesülnie kell az Z −1 = b1 θ2 + q0
és 0
R
1
log(x)
egyenloségnek, azonban a 2.24. példából tudjuk, hogy a bal oldalon álló integrál nem elemi.
Risch-algoritmus: exponenciális eset
θ transzcendens és exponenciális, θ0 /θ = f (θ) = q(θ)g(θ) + h(θ), ahonnan Z Z Z h(θ) f (θ ) = q(θ) + . g(θ) g(θ)
Most feltesszük, hogy osztással
0
u , u
∈
Kn−1 . Maradékos
85
2.4. Szimbolikus integrálás
Tervünk az, hogy a racionális részre Hermite módszerét fogjuk alkalmazni. Kellemetlen g j (θ) függmeglepetés ér azonban bennünket, mert a négyzetmentes felbontásban szereplo vényekre bár lnko (g j (θ),
d dθ
! g j (θ ) )
0
nyilván teljesül, a jóval erosebb lnko g j (θ), g j (θ)
θ, akkor lnko g j (θ), g j (θ)
0
=1
= 1 feltétel már nem. Például ha g j (θ) =
= lnko(θ, u0 θ) = θ .
Megmutatható azonban, hogy ez a kellemetlen jelenség nem lép fel, ha
0
már lnko g j (θ), g j (θ)
=
1. Elég tehát, ha a
θ
θ 6|
g j (θ), ekkor
eltávolítjuk a nevezob ol. Legyen tényezot
= θ` g(θ), ahol már θ 6 | g(θ), és keressünk olyan h(θ), s(θ) ∈ Kn−1 [θ] polinomokat, ` amelyekre h(θ)θ + t(θ)g(θ) = h(θ), deg h(θ) < deg g(θ) és deg s(θ) < `. Mindkét oldalt osztva g(θ)-val azt kapjuk, hogy g(θ)
f (θ( g(θ) A p(θ)
= q(θ) + t(θ)/θl jelöléssel
= q(θ) +
t(θ)
θl
+
h(θ) g(θ)
.
p(θ) véges Laurent-sor, ennek integrálása azonban semmi-
ha meggondoljuk, vel sem lesz nehezebb, mint egy polinom integrálása. Ez nem meglepo, hogy
θ−1 =
exp(−u). Még így is, itt is a
kezdjük.
polinomrész integrálása a nehezebb. A másikkal
Exponenciális eset, racionális rész Legyen g(θ) lnko
= g1 (θ)g22 (θ) · · · gm (θ) a g(θ) négyzetmentes m 0 g j (θ), g j (θ) = 1. Parciális törtekre bontással h(θ) g(θ)
=
m X i X hi, j (θ) i= 1
j= 1
gi (θ) j
felbontása. Ekkor
θ 6|
g j (θ) miatt
.
A Hermite-redukció ugyanúgy megy, mint a logaritmikus résznél. Azt kapjuk, hogy
Z
h(θ) g(θ)
=
c(θ) d(θ)
Z +
a(θ) b(θ)
,
ahol a(θ), b(θ), c(θ), d(θ) ∈ Kn−1 [θ], deg a(θ) < deg b(θ) és b(θ) négyzetmentes fopolinom, θ 6 | b(θ). R Megmutatható, hogy az a(θ)/b(θ) integrál kiszámítására a RothsteinTrager-módszer alkalmazható. Számítsuk ki a r(y)
= resθ
b(θ), a(θ)
− y · b(θ)0
rezultánst. Megmutatható, hogy az integrál pontosan akkor elemi, ha r(y) írható, ahol r(y)
∈
K[y] és s
∈
=
r(y)s alakban
Kn−1 . Ha tehát kiszámítjuk r(y) primitív részét, ezt választjuk
r(y)-nak, és r(y) bármelyik együtthatója nem konstans, akkor nem létezik elemi integrál. gyökei annak felbontási testében és legyen Egyébként legyenek c1 , . . . , ck az r(y) különbözo v i (θ )
= lnko
b(θ), a(θ)
− ci b(θ)0 ∈
Kn−1 (c1 , . . . , ck )[θ]
,
86 ha i
2. Komputeralgebra
= 1, . . . , k. Megmutatható, hogy k Z k X X a(θ) = − ( ci deg vi (θ)) + ci log b(θ) i=1 i=1
vi (θ)
.
Nézzünk néhány példát.
R 2.28. példa. Az
+ exp(x) integrál integrandusa 1/(1 + θ) ∈ Q(x, θ), ahol θ = exp(x). Mivel
1/ 1
r(y)
= resθ (θ + 1, 1 − yθ) = −1 − y ∈ Q(x)[y]
primitív polinom és csak konstans együtthatói vannak, az integrál elemi, c1 1, 1
+ θ) = 1 + θ, így Z 1
R 2.29. példa. Az
1
+ exp(x)
x/ 1
= −c1 x deg v1 (θ) + c1 log
+ exp(x) r(y)
v1 (θ)
integrál integrandusa x/(1
= x − log
= −1,
exp(x)
v1 ( θ )
=
lnko(θ
+
+1 .
+ θ) ∈ Q(x, θ), ahol θ = exp(x). Mivel
= resθ (θ + 1, x − yθ) = − x − y ∈ Q(x)[y]
primitív polinom, amelynek van nem konstans együtthatója, az integrál nem elemi.
Exponenciális eset, polinom rész Marad a p(θ)
=
k X
pi θ
i
∈
Kn−1 (θ)
i=−`
R
polinomrész integrálásának problémája. A Liouville-elv szerint elemi, ha p(θ)
= v0 (θ)0 +
m X
cj j=1
ahol c j Kn−1
=
∈
K és v j
∈
Kn−1 (θ), ha j
= 0, 1, . . . , m,
v j (θ )
p(θ) pontosan akkor
0
v j (θ )
,
továbbá KC a K valamely bovítése és
K(x, θ1 , . . . , θn−1 ). Megmutatható, hogy K lehet a K egy algebrai bovítése. Ha-
sonlóan érvelve, mint a Liouville-elv bizonyításában, megmutatható, hogy az általánosság megszorítása nélkül feltehetjük: v j (θ) vagy Kn−1 eleme (azaz független fopolinom és irreducibilis Kn−1 [θ]-ban, ha j
= 1, 2, . . . , m.
θ-tól)
vagy pedig
Továbbá az is belátható, hogy
mivel egy ilyen tényezo megmaradna a v0 (θ) nevezojében nem lehet nem monom tényezo, derivált nevezojében is. Hasonlóan v j (θ)-nak ( j
= 1, 2, . . . , m)
sem lehet nem monom té-
nyezoje. Így azt kapjuk, hogy v j (θ) vagy Kn−1 eleme, vagy pedig v j (θ) egyetlen irreducibilis monom, amely fopolinom. Ha azonban v j (θ) tag az összegben c j v j (θ)
0
= θ, mivel ez az = θ, akkor a megfelelo
azt kapjuk, hogy /v j (θ) = c j u0 , ami beolvasztható v0 (θ)0 -be. Ebbol
ha p(θ)-nak van elemi integrálja, akkor
k 0 m X X vj 0 j , cj q j θ ) + p(θ) = ( vj j=−`
j=1
87
2.4. Szimbolikus integrálás
ahol q j , v j
∈
Kn−1 és c j
∈
összegben meg kell K; az, hogy az összegzési határok az elso
összegzési határokkal, következik abból, hogy egyezzenek a p(θ) eloállításában szereplo j
0
(q j θ )
= (q0j +
0
ju g j )θ
j
.
Az együtthatók összehasonlításával a
pj p0
0
= =
0 q0
=
0
ju q j ,
= q0 +
egyenletrendszert kapjuk, ahol q0 szeruen q0
+ ,
qj
R
ha
Pm
j=1
−` ≤ j ≤ k, j , 0 ,
c j log(v j ). A p0
R
p0 ; ha ez az integrál nem elemi, akkor
,
akkor meghatároztuk q0 -at. A j
= q00 egyenlet megoldása egy-
p(θ) sem elemi, ha viszont elemi,
0 esetben egy differenciálegyenletet kell megoldanunk
q j meghatározásához, az úgynevezett Risch-differenciálegyenletet. A differenciálegyenlet
0
y
+
fy
=
g alakú, ahol az adott f , g függvények Kn−1 elemei és Kn−1 -beli megoldásokat
pillantásra úgy tunik, keresünk. Elso hogy az integrálás problémáját egy nehezebb problémával helyettesítettük, azonban az, hogy az egyenletek lineárisak, a megoldásnak pedig Kn−1 -ben kell lenni, sokat R segít. Ha valamelyik Risch-differenciálegyenletnek nincs Kn−1 p(θ) nem elemi, egyébként
beli megoldása, akkor
Z p(θ)
=
X
q jθ
j
+ q0 .
j,0
A Risch-differenciálegyenlet algoritmussal megoldható, ezt nem részletezzük. Tekintsünk néhány példát.
R
exp(− x ) integrál integrandusa
R
akkor
θ=
q1 θ, ahol q1
R
megoldása, így
exp(− x ) nem elemi. 2
R 2.31. példa. Az
θ ∈ Q(x, θ), ahol θ = exp(− x2 ). Ha az integrál elemi, ∈ C(x). Nem nehéz belátni, hogy a differenciálegyenletnek nincs racionális 2
2.30. példa. Az
x
x integrál integrandusa exp (x log(x)
R
= θ2 ∈ Q(x, θ1 , θ2 ), ahol θ1 = log(x) és θ2 =
exp(xθ1 ). Ha az integrál elemi, akkor θ2 = q1 θ2 , ahol q1 ∈ C(x, θ1 ). Mindkét oldalt differenciálva θ2 = q01 θ2 + q1 (θ1 + 1)θ2 , ahonnan 1 = q01 + (θ1 + 1)q1 . Mivel θ1 transzcendens R C(x) felett, az együtthatók 0 x összehasonlításával 1 = q1 + q1 és 0 = q1 , aminek nincs megoldása. így x nem elemi.
2.32. példa. Az
Z
(4x
2
+ 4x − 1)
2
exp(x ) (x
+1
2
exp(x )
−1
+ 1)2
integrál integrandusa
+ 4x − 1 2 (θ − 1) ∈ Q(x, θ) , (x + 1)2 R 2 2 ahol θ = exp(x ). Ha az integrál elemi, akkor f (θ) = q2 θ + q0 alakú, ahol f (θ)
=
0 q2
4x
2
+ 4xq2
=
4x
2
+ 4x − 1 , + 1)2
(x
88
2. Komputeralgebra
0 q0
=
−
4x
2
+ 4x − 1 . + 1)2
(x
egyenletnek megoldása q2 A második egyenlet integrálható, és q0 elemi. Az elso
Z
f (θ)
=
1 x
2
+1
2
exp (x )
−
(2x x
+ 1) + 4 log(x + 1) . +1
Gyakorlatok 2.4-1. Alkalmazzuk a Hermite-redukciót az alábbi f (x) f (x)
=
441x
7
= 1/(1 + x). Innen
2
∈ Q(x) függvényre:
+ 780x6 − 286x5 + 4085x4 + 769x3 + 3713x2 − 43253x + 24500 . 9x6 + 6x5 − 65x4 + 20x3 + 135x2 − 154x + 49 R
2.4-2. Számítsuk ki az
f (x)
=
36x
6
f integrált, ahol
+ 126x5 + 183x4 + 13807/6x3 − 407x2 − 3242/5x + 3044/15 ∈ Q(x) . (x2 + 7/6x + 1/3)2 (x − 2/5)3
2.4-3. Alkalmazzuk a Risch-algoritmust az alábbi integrál kiszámítására:
Z
x(x
2
2
+ 1){(x2 e2x − log(x + 1)2 ) + 2xe3x (x − (2x3 + 2x2 + x + 1) log(x + 1))} dx . 2 ((x + 1) log (x + 1) − (x3 + x2 )e2x )2 2
2.5. Elmélet és gyakorlat A fejezet eddigi részében arra törekedtünk, hogy néhány lényeges szimbolikus algoritmus bemutatásán keresztül érzékeltessük a komputeralgebra tudományterületének algoritmuster o Olvasó áttekintést kaphat a szimbolikus vezési problémáit. A következokben az érdeklod algoritmusok kutatásának szélesebb világából.
2.5.1. Egyéb szimbolikus algoritmusok A fejezetben bemutatott rezultánsmódszer és a Gröbner-bázis elmélet mellett létezik algo ritmus nemlineáris egyenletek és egyenlotlenségek valós szimbolikus gyökeinek meghatározására is (Collins). Figyelemre méltó algoritmusok születtek differenciálegyenletek szimbolikus megoldásainak
vizsgálata
során.
A
Risch-algoritmushoz
hasonló
döntési
eljárás
létezik
racionálisfüggvény-együtthatójú homogén másodrendu közönséges differenciálegyenletek zárt alakú megoldásainak kiszámítására. Magasabb rendu lineáris esetben az Abramoveljárás a polinomegyütthatós egyenletek zárt racionális megoldásait, a Bronstein-algoritmus R pedig az exp(
f (x)d x) alakú megoldásokat határozza meg. Parciális differenciálegyenletek
esetében a Lie-féle szimmetria-módszerek állnak rendelkezésre. Létezik algoritmus formális hatványsorok és racionális függvények feletti lineáris differenciáloperátorok faktorizálására is.
89
2.5. Elmélet és gyakorlat
A faktorizáláson alapuló eljárások komoly jelentoséggel bírnak a komputeralgebrai algoritmusok kutatásában. Olyannyira igaz ez a megállapítás, hogy sokan az egész tudományterület születését Berlekamp azon publikációjától számítják, amelyben hatékony algoritmust ad kis p karakterisztikájú véges testek feletti egyhatározatlanú polinomok faktorizációjára. Berlekamp eredményét késobb nagyobb p karakterisztikákra is kiterjesztette. Azért, hogy kapjon, az algoritmusába véletlen elemeket illesztett. A mai kompuhasonlóan jó futási idot teralgebra rendszerek nagyobb véges testekre is rutinszeruen alkalmazzák Berlekamp eljá rását talán anélkül, hogy a felhasználók többségének az algoritmus valószínuségi eredetérol tudomása lenne. A módszer könyvünk második kötetében kerül ismertetésre. Megjegyezzük, hogy véges testek feletti polinomok faktorizálására számos algoritmus létezik. Nem sokkal azután, hogy a véges testek feletti polinomfaktorizáció megoldódott, Zassenhaus van der Waerden 1936-os Moderne Algebra könyvét alapul véve a p-adikus számok aritmetikájának ún. Hensel-lemmáját alkalmazta a faktorok kiterjesztésére. A Hensel lifting ahogy ma az eljárását nevezik általános megközelítési módszer arra, hogyan Az interpolációval ellentétben, ami több rekonstruáljuk a faktorokat moduláris képeikbol. képpont meglétét követeli meg, a Hensel-lifting kiindulásul csak egyetlen képpontot igényel. Az egész együtthatós polinomok faktorizációjára adott BerlekampZassenhaus-féle jelentoség algoritmus alapveto u, mégis rejteget magában két csapdát. Az egyik, hogy bizonyos fajta polinomokra az algoritmus futási ideje exponenciális. Sajnos, az algebrai szám A másorossz polinom kerül elo. dik, hogy többváltozós polinomokra hasonló reprezentációs probléma lép fel, mint amilyet
testekre épített polinomok faktorizációjánál sok ilyen
problémát egy, a számok georitka mátrixok Gauss-eliminációjánál tapasztalunk. Az elso metriáján alapuló diofantoszi optimalizálás, a LenstraLenstraLovász nevével fémjelzett ún. rácsredukciós algoritmus oldotta meg, amit a Berlekamp-módszerrel együtt használnak. Ezen polinomiális algoritmus mellé még egy olyan eljárás társul, amely arról gondoskodik, induljon és megfelelo idoben jó moduláris képrol véget érjen. A többváltozós polinomfaktorizáció említett reprezentációs problémájára is születtek meghogy a Hensel-lifting
oldások. Ez a második olyan terület, ahol a véletlenítés kritikus szerepet kap a hatékony algoritmusok tervezésében. Megjegyezzük, hogy a gyakorlatban a BerlekampZassenhaus Hensel-féle algoritmus hatékonyabban muködik, mint a LenstraLenstraLovász-féle eljárás.
Összevetésképpen a polinomfaktorizálás problémája tehát polinomiális idoben meg-
e oldható, míg az N egész faktorizálására a bizonyítottan legjobb algoritmikus korlát O(N (Pollard és Strassen) a determinisztikus, és L(N) √ ségi esetben, ahol L(N)
=e
ln N ln ln N
1+o(1)
1/4
)
(Lenstra és Pomerance) a valószínu
.
Valójában a heurisztikus, valószínuségi módszereknek egy új elmélete van születoben a komputeralgebrában egyrészt az számítási tárrobbanás elkerülésére, másrészt a determinisztikusan nagy futási ideju algoritmusok hatékonyságának növelésére. A valószínuségi al muködésnek goritmusok esetében a nem megfelelo is van pozitív valószínusége, ami vagy az esetleges rossz válaszban nyilvánul meg (Monte Carlo csoport), vagy, habár sohasem hogy polinomiális idoben kapunk rossz választ (Las Vegas csoport), elképzelheto, nem kapunk semmit. A már említetteken kívül heurisztikákkal szép eredményeket értek el többek között polinomazonosság tesztelésénél, polinomok irreducibilitásának vizsgálatánál, mátrixok normálformáinak (Frobenius, Hilbert, Smith) meghatározásánál.
Szerepük minden
valószínuség szerint a jövoben is növekedni fog. A fejezet eddigi részében a lényegesebb szimbolikus algoritmusokat tekintettük át. Már a bevezetoben említettük, hogy a komputeralgebra-rendszerek többsége képes numerikus
90
2. Komputeralgebra
számítások elvégzésére is: a hagyományostól eltéroen a számítási pontosságot a felhasználó határozhatja meg. Gyakran elofordul, hogy a szimbolikus és numerikus számításokat együtt célszeru használni. Tekintsük például egy differenciálegyenlet szimbolikusan kiszámolt hatványsor megoldását. A csonkított hatványsort ezután bizonyos pontokban a szokásos lebe gopontos aritmetikával kiértékelve a differenciálegyenlet megoldásának numerikus approximációját kapjuk. Amennyiben a megoldandó probléma valamilyen valós zikai probléma approximációja, a szimbolikus számítások vonzó lehetoségei gyakran érvényüket vesztik; egyszeruen mert túl bonyolultak vagy túl lassúak ahhoz, hogy hasznosak vagy szükségesek legyenek, hiszen a megoldást is numerikusan keressük. Más esetekben, ha a probléma szimbolikusan kezelhetetlen, az egyetlen lehetséges út a numerikus approximációs módsze ha a létezo szimbolikus algoritmus nem talál zárt rek használata. Ilyen akkor fordulhat elo, megoldást (pl. nem elemi függvények integrálja stb.), vagy nem létezik a problémát kezelni tudó szimbolikus algoritmus. Ámbár egyre több numerikus algoritmusnak létezik szimboli kus megfeleloje, a numerikus eljárások nagyon fontosak a komputeralgebrában. Gondoljunk csak a differenciál- és integrálszámítás területére: bizonyos esetekben a hagyományos algoritmusok integráltranszformációk, hatványsor-approximációk, perturbációs módszerek lehetnek a legcélravezetobbek. A komputeralgebra algoritmusok tervezésénél a jövoben egyre nagyobb szerepet kap algoritmus nak a párhuzamos architektúrájú számítógépek. Habár sok meglévo
ránézésre párhuzamosítható, nem biztos, hogy a jó szekvenciális algoritmusok párhuzamos architek eljárással érheto túrákon is a legjobbak lesznek: az optimum talán egy teljesen különbözo el.
2.5.2. A komputeralgebra-rendszerek áttekintése A komputeralgebra-rendszerek fejlodésének története szoros kapcsolatban áll az informa tika és az algoritmikus matematika fejlodésével. A számítástechnika kezdeti idoszakában tudományterületek muvel szimbolikus számítási igényeik megkönnyítése és a különbözo oi komputeralgebra-rendszereket, amefelgyorsítása érdekében kezdték el fejleszteni az elso lyek átdolgozva, folyamatosan megújulva és a sokadik változatban napjainkban is jelen vannak. A hetvenes években jelentek meg az általános célú komputeralgebra-rendszerek, amelyeket beépített adatstruktúrák, matematikai függvények és algoritmusok széles tárháza számítógéjellemez, minél nagyobb felhasználói területet próbálva meg lefedni. A jelentos pes eroforrásigény miatt robbanásszeru elterjedésük a nyolcvanas évek elejére, a mikropro A jobb hardver környezet, a cesszor alapú munkaállomások megjelenésének idejére teheto. hatékonyabb eroforrás-gazdálkodás, rendszerfüggetlen, magasszintu alapnyelv használata, és nem utolsósorban a társadalmi-gazdasági igények fokozatosan piaci termékké érlelték az javulást hozott a felhasználói általános célú komputeralgebra-rendszereket, ami viszont eros felület és dokumentumkészítés terén. Az alábbiakban a legismertebb általános és speciális célú komputeralgebra rendszereket, könyvtárakat soroljuk fel.
•
Általános célú komputeralgebra rendszerek: A, D, F, GNU-, J, M, M, M, D M, MCAD, M S M T, S, MAS, M, M, M-M, MPAD, R, R.
91
2. Feladatok
•
Algebra és számelmélet: B, CCA, F, F, GRB, K, M, M, N, P, S, S.
• • •
Algebrai geometria: C, G. Csoportelmélet: G, LE, M, S. Tenzor analízis: C, FC, GRG, GRT, MT, RT, R, TTC.
•
Komputeralgebra könyvtárak: A, BN, GNU MP, K, LDA, NTL, S, U, W, Z.
Az általános célú komputeralgebra rendszerek többsége olyan tulajdonságokkal bír, mint
• • •
interaktivitás, matematikai tények ismerete, 2
matematikai objektumok kezelésére képes deklaratív , magas szintu programozási nyelv funkcionális programozási lehetoségekkel,
• • • • • • •
az operációs rendszer és más programok felé való kiterjeszthetoség, szimbolikus és numerikus számítások integrálása, automatikus (optimalizált) C és Fortran kódszegmens generálása, grakus felhasználói környezet, 2 és 3 dimenziós graka, animáció, AT X konverzió, szövegszerkesztési lehetoség és automatikus L E
on-line súgó.
A komputeralgebra-rendszereket matematikai szakértoi rendszereknek is nevezik. Nap iramú fejlodésének jainkban az általános célú komputeralgebra-rendszerek szédíto lehe tünk szemtanúi, elsosorban tudásuknak és széles köru alkalmazhatóságuknak köszönhetoen. Mégis hiba volna alábecsülni a speciális rendszereket, amelyek egyrészt igen fontos szerepet és hatékojátszanak sok tudományterületen, másrészt sok esetben könnyebben kezelhetok nyabbak, jelölésrendszerük és algoritmusaik alacsony szintu programnyelvi implementációja miatt. Nagyon lényeges, hogy egy adott probléma megoldásához az arra legalkalmasabb komputeralgebra-rendszert válasszuk ki.
Feladatok 2-1. Maradékos osztás maradéksorozata együtthatói hosszának vizsgálata Generáljunk két (n
=
10)-ed fokú pszeudovéletlen polinomot
Z[x]-ben
l
=
10 decimális
álló együtthatókkal. Hajtsunk végre egyetlen maradékos osztást (Q[x]-ben) és szájegybol mítsuk ki a maradék polinom és az eredeti polinom (λ függvénnyel meghatározott) maximális együtthatóhosszának arányát. Ismételjük meg a számításokat (t
= 20)-szor és számítsunk = 100, 500, 1000 ese-
átlagot. Mennyi lesz a kapott érték? Ismételjük meg a fenti kísérletet l tén.
2
utat, mint ahogy A deklaratív programozási nyelvek a kívánt eredményt specikálják és nem a hozzájuk vezeto
az imperatív nyelvek teszik.
92
2. Komputeralgebra
2-2. M --´ algoritmus szimulációs vizsgálata ´ Szimulációs vizsgálattal adjunk becslést a M --´ algoritmusban az ´ fokszám és n változó optimális értékére. Használjunk véletlen polinomokat különbözo együttható-nagyság esetén. 2-3. Módosított pszeudo-maradékos osztás Legyen f , g
∈ Z[x],
deg f
=
m
≥
n
=
deg g. A pszeudo-maradékos osztást módosítsuk oly
módon, hogy a s
gn f
= gq + r
= m − n + 1 kitevo helyett a leheto legkisebb olyan s ∈ N érték szerepeljen, ∈ Z[x]. Az így származtatott spquo() és sprem() eljárásokkal helyettesítve a P´-E algoritmus pquo() és prem() eljárásait véletlen polinomokat alkalmazva
egyenletnél az s amellyel q, r
vessük össze az algoritmusok tárigényét. 2-4. Redukált Gröbner-bázis konstrukciója Tervezzünk algoritmust, amely adott G Gröbner-bázisból redukált Gröbner-bázist állít elo. 2-5. A Hermite-redukció megvalósítása Valósítsuk meg a Hermite-redukciót valamilyen választott komputeralgebra nyelven. 2-6. Racionális törtfüggvény integrálása Írjunk programot a racionális törtfüggvények integrálására.
Megjegyzések a fejezethez A K-E és B ´-E algoritmusok nemnegatív egész beme változata megtalálható [90]-ben. A rezultánsok elméletének természenet esetén muköd o tes folytatásaként juthatunk el a szubrezultánsokhoz, melynek segítségével a B ´E algoritmus során látott együttható-növekedés jól kordában tartható (lásd például [152, 480]). A Gröbner-bázisokat B. Buchberger vezette be 1965-ben [62]. Polinomideálok bázisa is foglalkozott ezt megeloz oen. ival több szerzo A legismertebb talán Hironaka, aki 1964ben
C
feletti szingularitások feloldására hatványsorok ideáljainak bázisát használta. Mun-
kájáért Fields-érmet kapott. Azonban Hironaka módszere nem volt konstruktív. A Gröbnerbázisokat az utóbbi két évtizedben számos algebrai struktúrára általánosították. A differenciálalgebra alapjait J. F. Ritt fektette le 1948-ban [389]. A szimbolikus integrálás során használt négyzetmentes felbontás algoritmusa megtalálható például [480, 152] legkisebbre választásának könyvekben. A Hermite-redukcióban a testbovítés foka leheto fontosságát igazolja a [152]-ben található 11.11. példa, amelyben a felbontási test rendkívül magas fokú, míg az integrál egy másodfokú testbovítésben felírható. A RothsteinTragerféle integráló algoritmus bizonyítása megtalálható [480]-ben (22.8. tétel). Megjegyezzük, hogy az algoritmust Rothstein és Trager egymástól függetlenül találták. A LazardRioboo Trager-formula helyességének bizonyítása, a L- ´ - ´ algoritmus futási idejének elemzése, az algebrai kiterjesztési lépések nehézségének kezelésével kapcsolatos eljárások vázlatos ismertetése, a C(x) felett hiperexponenciális elem hiperexponenciális integráljának meghatározása (ha ilyen létezik), a Liouville-elv bizonyítása, a Rischalgoritmussal kapcsolatos állítások bizonyításai megtalálhatók a [480] könyvben. számos publikáció és A komputeralgebráról és a kapcsolódó tudományterületekrol
2. Megjegyzések a fejezethez
93
el. Angolul az érdeklod oknek könyv született. Magyar nyelven [90], [171] és [264] érheto az összefoglaló matematikai jellegu munkák közül felsorolunk néhányat: Caviness [71], Davenport és társai [100], von zur Gathen és társai [480], Geddes és társai [152], Knuth [258, 259, 260], Mignotte [328], Mishra [334], Pavelle és társai [362], Winkler [498]. o Olvasó további információt taA komputeralgebra informatikai oldaláról az érdeklod lálhat az alábbiakban: Christensen [75], Gonnet és Gruntz [164], Harper és társai [193], valamint a világhálón. Az alkalmazásokról könyvek és cikkek nagyon széles választéka áll rendelkezésre, pl. Akritas [8], Cohen és társai (ed.) [85, 86], Grossman (ed.) [179], Hearn (ed.) [198], Kovács [263] és Odlyzko [352]. lásd pl. Karian [239] és A komputeralgebra-rendszerek oktatásban betöltött szerepérol Uhl [472] munkáját. Konferencia kiadványok: A, D, E, E, I és S. Komputeralgebra folyóiratok: Journal of Symbolic Computation Academic Press, Applicable Algebra in Engineering, Communication and Computing Springer-Verlag, S-
Bulletin ACM Press. Az Eötvös Loránd Tudományegyetem Informatikai Karának Komputeralgebra Tanszéke az oktatásban a [152, 328, 480, 498] munkákat veszi alapul.
3. Kriptográfia
probléEbben a fejezetben a kriptográában használatos protokollokat, valamint alapveto egyik alaphelyzetet látmákat és algoritmusokat mutatunk be. A kriptográában jellemzo hatjuk a 3.1. ábrán. Aliz és Bob híreket cserélnek valamilyen nem biztonságos csatornán, számítógép közötti például nyilvános telefonvonalon, vagy két hálózati kapcsolatban lévo elektronikus posta segítségével. Erik megcsapolja a vezetéket, és lehallgatja a kommunikációt. Mivel Aliz és Bob tudják ezt, a küldeményeiket rejtjelezik.
Erik
3.1. ábra. A kriptográában tipikus alaphelyzet.
A 3.1. alfejezetben olyan szimmetrikus kriptográai rendszereket mutatunk be, amelyek az illetéktelen rejtjelfejtést hivatottak akadályozni. Szimmetrikusnak akkor nevezünk egy kriptográai rendszert, ha ugyanaz a kulcs használható rejtjelezésre (sifrírozásra) és visszafejtésre (desifrírozásra) is. Vajon hogyan kell Aliznak és Bobnak egy közös kulcsban megegyeznie, ha csupán egy megbízhatatlan csatornán tudnak kommunikálni egymással? Ha például Aliz választ egy kulcsot és rejtjelezi (mondjuk egy szimmetrikus rejtjelrendszerrel), majd elküldi Bobnak, azonnal felmerül a kérdés, milyen kulcsot használjanak ezeknek a kulcsoknak a rejtjelezéséhez. kérdés amely egy kicsit emlékeztet arra a másikra, hogy vajon Ez a paradoxnak tun o a tojás, vagy a tyúk volt-e elobb kulcscsere-problémaként ismert. A kriptográa kezde megoldhatatlannak tartották ezt a problémát. Annál nagyobb volt a meglepetés, amitétol kor Whiteld Diffie és Martin Hellman 1976-ban megoldották. Egy protokollt javasoltak, amelyben Aliz és Bob információkat cserélnek, s ennek segítségével végül ki tudják számí tani a közös kulcsukat. Az oket lehallgató Eriknek ugyanakkor fogalma sincs a kulcsukról, minden egyes bitet el tudja fogni. A 3.2. alfemég akkor sem, ha az adatcserében résztvevo jezet bemutatja a DiffieHellman-protokollt.
95
3.1. Alapok
A történet némileg ironikus része az, hogy éppen ez a protokoll, amely a szimmetrikus kriptográában oly fontos kulcscsere megoldhatatlannak tartott problémáját megoldotta, egyengette az utat, s ez utóbbiban a megbízhatatlan egy másik protokoll felfedezése elott titkos kulcscsere már semmilyen szerepet nem játszik. Diffie és Hellman csatornán történo 1976-ban megjelent munkájukkal kaput nyitottak a modern nyilvános kulcsú kriptográ ának, és már két évvel késobb, 1978-ban, Rivest, Shamir és Adleman szélesre tárták ezt a nyilvános kulcsú kriptokaput, amikor megalkották jól ismert RSA-rendszerükkel az elso rendszert. A 3.3. alfejezetben szerepel az RSA-rendszer, valamint egy, az RSA-n alapuló digitális aláírásra vonatkozó protokoll. Egy ilyen protokollal Aliz el tudja látni kézjegyével Bobnak küldött üzeneteit úgy, hogy Bob az üzenet küldojének azonosságát ellenorizni tudja. A digitális aláírások célja annak megakadályozása, hogy Erik Aliz üzenetét meghamisítva úgy tegyen, mintha azt Aliz küldte volna. A DiffieHellman-protokoll biztonsága azon a feltételezésen alapszik, hogy a diszkrét logaritmus nem számítható ki hatékonyan. A moduláris hatványozás amelynek inverz függvénye a diszkrét logaritmus egy lehetséges egyirányú függvény. Az RSA biztonsága is egy probléma feltételezett nehézségén nyugszik, nevezetesen azon a feltételezésen, hogy szorzatára. A jogos címzett Bob nagy számok nem bonthatók hatékonyan prímtényezok ugyanakkor képes hatékonyan visszafejteni a rejtjelezett üzenetet, miközben egy általa választott szám faktorizációját saját
csapóajtó információjaként használja fel. A 3.4. alfejezetben bemutatunk egy RivestSherman-protokollt, amelyik az úgyneve-
zett erosen nem invertálható, asszociatív egyirányú függvényeken nyugszik, és a Diffie Hellman-protokollhoz hasonlóan titkos kulcscserére szolgál. Ez a protokoll is módosítható oly módon, hogy digitális aláírás számára használható legyen. Végül a 3.5. alfejezet az interaktív bizonyításrendszerek és a zéró-ismeretu protokollok érdekes területére vezet, amely a kriptográában gyakorlati felhasználásra kerül, nevezetesen a hitelesség problémájának megoldása során. Bemutatunk egy zéró-ismeretu protokollt a grázomorzmus problémára. Másrészt ez a terület a bonyolultságelmélethez is kapcso lódik, és ezért a 4. fejezetben újból elokerül, ismét a grázomorzmus problémával kapcsolatban.
3.1. Alapok muvészet A kriptográa évezredek óta létezo és tudomány, írások és üzenetek titkos olyan rejtjelezésével foglalkozik, amely illetéktelen személyek számára anyagba történo akadályozza a visszafejtést. Ebben az alfejezetben két klasszikus szimmetrikus kriptorend alfejezetekben pedig a manapság használatos legfontosabb szert mutatunk be, a következo protokollok és aszimmetrikus kriptorendszerek közül foglalkozunk néhánnyal. Protokol közötti párbeszédet értünk, miközben egy résztvevo lehet egy lon két vagy több résztvevo ember, de lehet egy számítógép is. A kriptográai protokollok szövegek rejtjelezésére szolgálnak, oly módon, hogy a jogosult fogadó képes legyen egyszeruen és hatékonyan vissza fejteni a rejtett szöveget. Egy protokoll algoritmusként is felfogható, melyet több résztvevo hajt végre. A kriptoanalízis szintén több évezredes muvészet és tudomány is, amely rejtjelezett kriptorendszerek feltörésével foglalkoüzenetek (illetéktelen) visszafejtésével és a létezo zik. A kriptológia ezt a két területet öleli fel, a kriptográát és a kriptoanalízist. Ebben
96
3. Kriptográa
a fejezetben foként olyan kriptograkus algoritmusokra koncentrálunk, amelyek lehetové teszik a biztonságos rejtjelezést. A kriptoanalízis algoritmusait amelyekkel az ember próbálkozik, hogy kriptograkus protokollokat és rendszereket feltörjön , megemlítjük, de nem vizsgáljuk teljes részletességgel.
3.1.1. Kriptográfia alaphelyzete a 3.1. ábrán látható: Aliz és Bob olyan nem A kriptográa egyik jellemzo biztonságos csatornán kommunikálnak egymással, amelyet Erik lehallgat, és ezért az üzenetüket rejtjelezik egy kriptorendszer segítségével. 3.1. deníció (kriptorendszer). A kriptorendszer egy (P, C, K, E, D) ötös a következo tulajdonságokkal: 1.
P, C és K
P a nyílt szöveg tér, C a rejtett szöveg tér és K a kulcstér. P C elemeit pedig rejtett szövegnek nevezzük. Egy üzenet a nyílt
véges halmazok,
elemeit nyílt szövegnek
szöveg szimbólumaiból álló szó. 2.
E = {Ek |
k
∈ K}
P → C függvényeknek a családja, amelyeket a D = {Dk | k ∈ K} azoknak a Dk : C → P függvényeknek a
azoknak az E k :
rejtjelezéshez használunk.
családja, amelyeket a visszafejtéshez használunk. 3.
Mindegyik e
∈K
kulcshoz van egy d
∈K
kulcs, melyekre minden p
∈ P nyílt szöveg
esetén Dd (E e ( p))
= p.
(3.1)
Egy kriptorendszerre azt mondjuk, hogy szimmetrikus (vagy titkos kulcsú), ha d vagy legalábbis d
=
e
könnyen kiszámítható e-bol. Egy kriptorendszerre azt mondjuk, hogy
aszimmetrikus (vagy nyilvános kulcsú,
public-key), ha d , e, és gyakorlatilag nem végezheto el az a feladat, hogy a d kulcsot e-bol kiszámítjuk. Ekkor e-t nyilvános kulcsnak nevezzük, és d az e-hez tartozó titkos kulcs. kulcstereket használnak a rejtjelezéshez és a visszafejtéshez, ami a Néha különbözo módosítását vonja maga után. fenti deníció megfelelo A klasszikus kriptorendszerek bemutatására példaként legyen a
Σ = {A, B, . . . , Z} ábécé
a nyílt szöveg tér és ugyanakkor a rejtett szöveg tér is. Abból a célból, hogy a betukkel úgy tudjunk számolni, mintha számok lennének, feleltessük meg
Σ-nak Z26 = {0, 1, . . . , 25}-öt.
A 0 szám tehát az A betunek felel meg, az 1 a B betunek stb. A nyílt szöveg szimbólumainak ez a természetes számokkal való kódolása természetesen nem tartozik hozzá a tényleges rejtjelezéshez, illetve visszafejtéshez. Az üzenetek
Σ∗
elemei, ahol
Σ∗
a
Σ fölötti szavak halmazát jelöli. Ha valamely m ∈ Σ∗
üzenet n hosszúságú blokkokra van felosztva, és blokkonként van rejtjelezve ahogyan az sok kriptorendszerben szokásos , akkor m egyes blokkjait 3.1. példa. Legyen
Zn26
elemeiként értelmezhetjük.
Az elso példa egy monoalfabetikus szimmetrikus kriptorendszer. Eltolásos rejtjelezo.
K = P = C = Z26 .
Az eltolásos rejtjel az a rejtett üzenet, amelyben a nyílt szöveg minden
jelének az ábécében a k számú betuvel eltolt jel felel meg (modulo 26), ahol k rögzített szám. Az itt k szereplo
∈ Z26
a kulcs. Ha a rejtett szöveg minden jelét ugyanennek a k kulcsnak a felhasználásával
függvényt és a Dk visszafejto visszatoljuk, akkor feltárul elottünk a nyílt szöveg. Az E k rejtjelezo
97
3.1. Alapok
m
B U D A P E S T
c
E X G D S H V W N H O H W S D U L C V D
K E L E T
P Á R I Z S A
sifrírozásra. 3.2. ábra. Példa a Caesar-rejtjelezovel történo
függvényt mindegyik k
∈ Z26
kulcs esetén az alábbi módon deniáljuk: E k (m)
=
(m
Dk (c)
=
(c
+ k) mod 26
− k) mod 26,
ahol a k-val való összeadást és kivonást jelenként, modulo 26 kell elvégezni. rejtjelezése k A 3.2. ábrán látható egy magyar m üzenetnek a c kóddal történo Az eltolással való rejtjelezés ezzel a speciális k
=
=
3 esetén.
1
3 kulccsal Caesar-rejtjelezo néven is ismeretes,
mert feltehetoen a római császár ezt használta háborúiban a katonai üzenetek titkosítására.
2
Ez egy
amelyikben a nyílt szöveg minden betujét nagyon egyszeru helyettesítéses rejtjelezo, a rejtjel ábécé egy meghatározott betujével helyettesítenek.
Mivel a kulcstér nagyon kicsi, az eltolásos rejtjelet igen könnyu feltörni. Ez a rejtjel már arra a támadásra is érzékeny, amelynek során a támadó csupán a rejtett szöveget ismeri (rejtett szövegu támadás,
ciphertext-only attacks). Ha egyszeruen a 26 lehetséges kulcs mindegyikét végigpróbáljuk, kiderül, hogy melyik kulcs esetén adódik rejtjelezés értelmes nyílt szöveg, ha pedig a rejtett szöveg elég hosszú, csak egy megfelelo adódik. monoalfabetikus kriptorendszer, mert a nyílt szöveg minden betuA Caesar-rejtjelezo jének a rejtett szövegben mindig ugyanaz a betu felel meg. Ezzel szemben egy polialfabetikus kriptorendszerben lehetséges, hogy ugyanannak a nyílt szövegbeli szimbólumnak kü rejtett szövegbeli szimbólumok felelnek meg, attól függoen, lönbözo hogy a szöveg melyik helyén állnak. Egy ilyen polialfabetikus kriptorendszert, amelyik az eltolásos rejtjelezésre épül, de jóval nehezebb feltörni, Blaise de Vigenère (15231596) francia diplomata javasolt. Rendszere Leon Battista Alberti (szül. 1404) itáliai matematikus, Johannes Trithemius (szül. 1492) német apát és Giovanni Porta (szül. 1535) itáliai természettudós elomunkáira úgy muködik, azzal a különbséggel, hogy épül. Ez a rejtjelezo mint az eltolásos rejtjelezo, a betuk, amelyekkel a nyílt szöveg egy szimbóluma sifrírozva van, most még a szövegbeli helyüknek megfeleloen is változnak. 3.2. példa.
Vigenère-rejtjelezo. Ez a szimmetrikus polialfabetikus kriptorendszer egy úgynevezett
Vigenère-négyzetet használ (lásd a 3.3. ábrát). Ez egy 26 sorból és 26 oszlopból álló mátrix. Mindegyik sorban az ábécé 26 betuje szerepel, sorról sorra mindig egy pozícióval balra tolva. Ez azt jelenti, hogy az egyes sorok felfoghatók egy-egy eltolásos rejtjelezoként, ahol a kulcsok sorban 0, 1, . . . , 25. függ az, hogy a Vigenère-négyzet melyik sorát használja az ember A szimbólum szövegbeli helyétol egy nyílt szövegbeli szimbólum rejtésére. Az üzeneteket n állandó hosszúságú blokkra osztjuk és blokkonként rejtjelezzük, vagyis
P = C = Zn26 . Az
K =
n blokkhosszat a rendszer periódusának is nevezik. Egy w szóban az i-edik betut
1
ékezet nélkülieké. A fordító. Az ékezetes betuk kódja ugyanaz, mint a megfelelo
2
Történelmi megjegyzés: Gaius Julius Caesar De Bello Gallico címu muvében tudósít arról, hogy a gall háborúban
(5850 Kr.e.) hogyan küldött egy rejtjelezett üzenetet Q. Tullius Ciceronak (a híres szónok testvéröccsének), aki légiójával ostrom alatt volt. Az alkalmazott rendszer monoalfabetikus volt, és a latin betuket göröggel helyettesí ol volt-e szó. Ezt tette, Caesar írásaiból nem derül ki azonban az, hogy valóban a k = 3 kulcsú eltolásos rejtjelezor az információt késobb Suetonius adta.
98
3. Kriptográa
0
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
1
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
2
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
3
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
4
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
5
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
6
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
7
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
V W X
8
I
J
K
L
M
N
O
P
Q
R
S
T
U
9
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
10
K
L
M
N
O
P
Q
R
S
T
U
V W X
11
L
M
N
O
P
Q
R
S
T
U
V W X
12
M
N
O
P
Q
R
S
T
U
V W X
13
N
O
P
Q
R
S
T
U
V W X
14
O
P
Q
R
S
T
U
V W X
15
P
Q
R
S
T
U
V W X
16
Q
R
S
T
U
V W X
17
R
S
T
U
V W X
V W X
18
S
T
U
19
T
U
V W X
20
U
V W X
V W X
Y
Z
Y
Z
A B
Y
Z
A
Y
Z
A
B
C
Y
Z
A
B
C
D E
Y
Z
A
B
C
D
Y
Z
A
B
C
D
E
F
Y
Z
A
B
C
D
E
F
G H
Y
Z
A
B
C
D
E
F
G
Y
Z
A
B
C
D
E
F
G
H
I
Y
Z
A
B
C
D
E
F
G
H
I
J K
Y
Z
A
B
C
D
E
F
G
H
I
J
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q R
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
21
V W X
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
22
W X
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
23
X
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W
24
Y
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
25
Z
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V W X
3.3. ábra. Vigenère-négyzet: a
H nyílt szöveget a
T kulccsal rejtjelezve
Y
A-t kapunk.
k
T O N Y T O N Y T
O N Y T O N Y T O N Y T
m
H U N G A R I A N
I
S
A L L
G R E E K
T O G E R M A N S
O N Y T O N Y
c
A I A E T F V Y G W F
Y E Z
T P X S X
R H U R P F O A Q
használó sifrírozásra. 3.4. ábra. Példa a Vigenère-rejtjelezot
wi -vel jelöljük. függvényt és a Dk visszafejto függvényt, amelyek mindketten Az E k rejtjelezo képeznek, mindegyik k
∈ Z26 n
n Z26 -be Zn26 -bol
kulcs esetén a következoképpen deniáljuk: E k (b)
=
(b
+ k) mod 26
Dk (c)
=
(c
− k) mod 26,
ahol a k-val való összeadást és kivonást megint jelenként kell elvégezni modulo 26. Ez azt jelenti, hogy a megbeszélt k
∈ Zn26
beture kulcsot betur ol a b
∈ Zn26
blokk szimbólumai fölé írjuk. Ha a
nyílt szöveg utolsó blokkjának kevesebb szimbóluma van, mint n, akkor a kulcsnak csak annyi jelét használjuk fel, amennyi szükséges. Amikor a nyílt szöveg i-edik bi szimbólumát rejtjelezzük, fölötte a ki kulcsszimbólum áll, és a Vigenère-négyzet ki -edik sorát használjuk eltolásos rejtjelezoként. Válasszuk például az n
=
4 blokkhosszat, és a k
=
TONY kulcsot. A 3.4. ábra egy angol nyelvu
m nyílt szöveg rejtjelezését mutatja, amelyik hét blokkból áll, és a c rejtett szövegben a Vigenère alkalmaztuk a k kulccsal. A nyílt szöveg elso betujéhez, rejtjelezot a
H-hoz a T kulcsszimbólu H-oszlopának és a T-sorának keresztezodésében A szimbóluma, amint azt a 3.3. ábrán láthatjuk. található, ez lesz a rejtett szöveg elso
mot rendeljük hozzá. A Vigenère-négyzet
Még számos további klasszikus kriptorendszer létezik, amelyeket azonban itt nem vizs Több lehetoség gálunk meg közelebbrol. van arra is, hogy a kriptorendszereket jellegük
99
3.1. Alapok
és tulajdonságaik alapján osztályozzuk. A 3.1. deníció megvilágítja a szimmetrikus és az aszimmetrikus kriptorendszerek közötti különbséget. A két bemutatott szimmetrikus rend és a Vigenère-rejtjelezo) rámutat a monoalfabetikus és a polialszer (az eltolásos rejtjelezo helyettesítéses rejtjelezo. fabetikus rendszerek közötti eltérésekre. Mindketto Ezek szembeállíthatók a permutációs rejtjelezokkel (más néven transzpozíciós rejtjelezokkel), amelyeknél a nyílt szöveg betuit nem a rejtjelábécé bizonyos betui helyettesítenek, hanem csupán a szövegbeli helyük változik, egyébként azonban nem változnak meg. Ha blokkonként n periódussal rejtjelezünk és mazzuk kulcstérként, ahol
Σ
Σn összes permutációinak halmazát alkaln
lehetoségünk m betus ábécé, akkor m ! különbözo van arra,
hogy egy kulcsot kiválasszunk. Továbbá a blokkrejtjelezot amelyben, mint a Vigenèrerendszer esetén a nyílt szöveget blokkokra osztjuk, blokkonként rejtjelezzük , egybevethetjük a folyamrejtjelekkel, amelyek egy folyamatos kulcsfolyamot hoznak létre. A blokkrejt különbözo változatait vizsgálhatjuk. Egy fontos típust képviselnek az affin blokkjelezok rejtjelezok. Ezeket a következoképpen deniáljuk: az E D
(A−1 ,~ b)
függvények visszafejto
n Zm -be Znm -bol
(A,~ b)
függvények, és a rejtjelezo
képeznek, és affin leképezések, ami azt je-
lenti, hogy az alábbi alakúak: E
(A,~ b)
D
(~ x)
(A−1 ,~ b)
Itt (A, ~ b) és (A elemekkel. A
−1
−1
, ~b)
(~ y)
= =
A~ x A
+ ~b mod m ,
−1
(3.2)
(~ y−~ b) mod m .
× n)-es mátrix Zm -beli Znm -beli vektorok, a muveleteket pedig
a rejtjelezés illetve visszafejtés kulcsai; A (n
az A inverz mátrixa; ~ x, ~ y és ~ b mind
modulo m végezzük. Nézzünk néhány matematikai kiegészítést (lásd a 3.1.3. pontban a 3.2.
Zm gyur u fölötti (n × n)-es A mátrixnak pontosan akkor van multip= 1. A inverz mátrixát A−1 = (det A)−1 Aadj segítségével i+ j deniáljuk, ahol det A az A determinánsa és Aadj = ((−1) det A j,i ) az A adjungált mátrixa. A det A determinánsát rekurzív módon deniáljuk: n = 1 és A = (a) esetén det A = a; Pn i+ j (−1) ai, j det Ai, j , ahol ai, j az n > 1 esetén minden i-re, ahol i ∈ {1, 2, . . . , n}, det A = j=1 A-nak az (i, j) indexu eleme és az (n − 1) × (n − 1)-es Ai, j mátrixokat az A-ból úgy kapjuk, deníciót is): egy a
likatív inverze, ha lnko(det A, m)
hogy az i-edik sort és a j-edik oszlopot törüljük. Egy mátrix determinánsát hatékonyan ki lehet számítani (lásd a 3-3. feladatot). affin rejtjelezo, amelynek kulcstere, Példaként megemlítjük, hogy a Vigenère-rejtjelezo
K = Znm
pontosan m elemu (lásd a 3.2. példát). Ha (3.2)-ben a ~ b nullvektor, akkor lineáris n
blokkrejtjelezor ol van szó. Erre klasszikus példa a Hill-rejtjelezo, amit 1929-ben Lester Hill
× n)-es Zm -beli elemeket tartal= 1. Emiatt a kulcsként megengedett mátrixok inver-
talált ki. Ennél a rejtjelezonél a kulcstér az összes olyan (n mazó A mátrix, melyre lnko(det A, m) tálhatók, s az A
−1
inverz mátrixszal fejthetjük vissza az A mátrixszal rejtjelezett üzenetet.
az E A (~ A Hill-rejtjelezot x)
=
függvénnyel és a DA−1 (~ A~ x mod m rejtjelezo y)
= A~y mod m
függvénnyel deniáljuk. Ez a legáltalánosabb lineáris rejtjelezo. A permutációs visszafejto szintén lineáris rejtjelezok, speciális esetei. rejtjelezok és így a Hill-rejtjelezok
3.1.2. Kriptoanalízis A kriptoanalízis feladata az, hogy adott kriptorendszereket feltörjön, elsosorban azért, hogy a szükséges kulcsot a visszafejtéshez megállapítsa. Attól függoen, hogy milyen információk állnak a kriptoanalízis rendelkezésére, a támadások több típusát lehet megkülönböztetni, és
100
3. Kriptográa
ezzel a vizsgált kriptorendszer biztonságát, illetve sérülékenységét jellemezni. Az eltolásos rejtjelezovel kapcsolatban már említettük a rejtett szövegu támadást. Ez a leggyengébb formája a támadásnak, és az a kriptorendszer, amelyik ennek a támadásnak sem áll ellen, nem sokat ér. érzékenyek az Az affin blokkrejtjelezok, mint például a Vigenère- és a Hill-rejtjelezok olyan támadásokra, amelyeknél a támadó egy elcsípett rejtjelezett szöveget és a hozzátar az alkalmazott kulcsra tozó nyílt szöveget is ismeri (ismert nyílt szövegu támadás, és ebbol következtetni tud. Még inkább érzékenyek az olyan támadásokra, amelyeknél a támadó saját maga ki tud választani egy nyílt szöveget, és utána látja, hogy milyen rejtett szöveg tartozik hozzá (választott nyílt szövegu támadás,
chosen-plaintext attacks). A negye dik fajta támadás foként az aszimmetrikus kriptorendszerekre hatásos. Az ilyen (rejtjelezo kulcs támadás,
encryption-key-attacks) esetén a támadó csupán a nyilvánosságra hozott az információból próbálja kulcsot ismeri, de nem ismer rejtett üzenetet, és egyedül ebbol meghatározni a titkos kulcsot. A különbség az, hogy a támadónak van ideje számításokat végezni, a többi támadás esetén azonban sietnie kell, mert az üzenetet már elküldték. Ezért kell aszimmetrikus kriptorendszerek esetén a kulcsteret nagynak választani, s ezzel szavatolni a rendszer biztonságát. Ennek következménye az, hogy a gyakorlatban sokszor kevéssé hatékonyak az aszimmetrikus rendszerek. Az ilyen támadások gyakran a rejtjelezett szövegben eloforduló betuk gyakoriságát vizsgálják. Emellett a nyílt szöveg számára alkalmazott természetes nyelv redundanciáját is kihasználják. Például sok természetes nyelvben az
E betu statisztikusan szignikáns tipikus szövegek vizsgálata szerint az E gyakorisága az angolban 12.31%, a franciában 15.87%, a németben pedig 18.46%. Más
Hosszú módon a leggyakrabban fordul elo.
nyelvekben más betuk léphetnek fel a legnagyobb gyakorisággal.
Tipikus nn szövegek A a leggyakoribb betu. A gyakoriságelemzés szemmel láthatóan hasznos a monoalfabetikus kriptorendszerek
ben például 12.06%-kal az
elleni támadás során. Ha például egy eltolásos rejtjelezovel rejtett német szövegben az
Y betu lép fel leggyakrabban, ami a németben akárcsak a legtöbb nyelvben ritka, akkor
arra következtethetünk, hogy ez az E rejtett változata, az alkalmazott kulcs pedig az ebbol U (k = 20) (lásd a 3.3. ábrát). Az egyes betuk gyakorisága mellett vizsgálhatjuk a betupá rok (digrammok), a betuhármasok (trigrammok) stb. A támadásnak ez a módja muködik a polialfabetikus kriptorendszerek esetében is, feltéve, hogy a periódus (vagyis a blokkhossz) ismert. Az ismeretlen periódusú polialfabetikus kriptorendszerek ezzel szemben nagyobb biz például hosszú ideig ellenállt minden feltörési tonságot nyújtanak. A Vigenère-rejtjelezo kísérletnek. Csak 1863-ban, mintegy 300 évvel a feltalálása után, talált módszert Friedrich feltörésére. Megmutatta, hoWilhelm Kasiski német kriproanalitikus a Vigenère-rejtjelezo gyan lehet meghatározni az alkalmazott periódust a kulcsszöveg szavainak ismétlodéséb ol akkor is, ha a periódus kezdetben ismeretlen volt. Végül a gyakoriságelemzés segítségével a Singh írja, hogy a rendkívül sokoldalú Charles Babbage, rejtjelezett szöveg visszafejtheto. akit sokan kora zsenijének tartanak, a Kasiski-féle módszert valószínuleg korábban,1854ben felfedezte, bár nem hozta nyilvánosságra. A kriptográa történetében mérföldkoként kell megemlítenünk Claude Shannonnak munkáját. Shannon be(19162001). a modern kód- és információelmélet atyjának úttöro bizonyította, hogy vannak kriptorendszerek, amelyek egy bizonyos szigorú matematikai ér telemben tökéletes titkosságot tesznek lehetové. Pontosabban szólva egy kriptorendszer ak-
101
3.1. Alapok
|C| = |K|, a kulcsok K -ban egyenletes eloszlásúak, és minden ∈ C-re pontosan egy k ∈ K kulcs van, amelyre Ek ( p) = c. Ez azt
kor tökéletes titkosságú, ha p
∈ P-re
és minden c
jelenti, hogy egy ilyen kriptorendszer a legtöbb gyakorlati célra nem használható, mert ahhoz, hogy tökéletes titkosságot garantálhassunk, egyrészt minden kulcsnak legalább olyan üzenet, másrészt egyszeri használat után minden hosszúnak kell lennie, mint a rejtjelezendo kriptorendszereket késobb kulcsot el kell dobni. Gyakorlati célra megfelelo fogunk ebben a fejezetben bemutatni.
3.1.3. Algebra, számelmélet és gráfelmélet algoritmusok és problémák közül néhánynak a megértéséhez seA késobb sorra kerülo néhány alapveto gítségünkre lesz az algebra, és foként a csoport- és számelmélet körébol fogalom és tétel. Vonatkozik ez mind a 3. fejezetbeli kriptorendszerekre és zéró-ismeretu protokollokra, mind pedig néhány, a 4. fejezetben vizsgált problémára. Az Olvasó megteheti, hogy ezt a fejezetet átugorja, és a szükséges fogalmaknak, eredményeknek csak akkor néz utána, ha késobb felbukkannak. A bizonyításoktól ebben a fejezetben többnyire eltekintünk. 3.2. deníció (csoport, gyur u, test).
•
G=
(S , ◦) csoport, ha S nem üres halmaz,
◦ kétváltozós muvelet S -en és teljesülnek a
következo axiómák:
zártság: (∀ x
asszociativitás: (∀ x
∈ S ) (∀y ∈ S ) [x ◦ y ∈ S ]; ∈ S ) (∀y ∈ S ) (∀z ∈ S ) [(x ◦ y) ◦ z = x ◦ (y ◦ z)]; semleges elem: (∃e ∈ S ) (∀ x ∈ S ) [e ◦ x = x ◦ e = x]; −1 inverz elem: (∀ x ∈ S ) (∃ x ∈ S ) [x ◦ x−1 = x−1 ◦ x = e].
G csoport semleges elemének, az x−1 elemet x inverzének nevezzük. G félcsoport, ha G-ben az asszociativitás és a zártság teljesül a ◦ muveletre, akkor is, ha G-nek nincs semleges eleme, vagy nem minden elemnek van inverze. Egy G = (S , ◦) félcsoport, vagy csoport kommutatív, ha x ◦ y = y ◦ x minden x, y ∈ S esetén teljesül. Egy G véges csoport elemeinek a száma a G rendje és ezt |G| jelöli. Az e elemet a
•
H = (T , ◦)-t a G = (S , ◦) csoport részcsoportjának nevezzük (H ≤ G jelöli), ha T ⊆ és H kielégíti a csoportaxiómákat.
•
Egy
S
R = (S , +, ·) hármas gyur u, ha (S , +) Abel-csoport, (S , ·) félcsoport és a disztribu-
tivitási szabály érvényben van: (∀ x
∈ S ) (∀y ∈ S ) (∀z ∈ S ) [(x · (y + z) = (x · y) + (x · z)) ∧ ((x + y) · z = (x · z) + (y · z))].
Egy
R=
(S , +, ·) gyur u kommutatív, ha az (S , ·) félcsoport kommutatív. Az (S , +) cso-
R gyur u nullelemének (röviden nullának), az (S , ·) R gyur u egységelemének (röviden egy) nevezzük.
port semleges elemét (ha létezik) az félcsoport semleges elemét az
•
Legyen
R =
(S , +, ·) egységelemes gyur u.
invertálhatónak (vagy
R valamely · y = y · x = 0.
ható. x
R
R
egy x elemét pontosan akkor nevezzük
egységének), ha ez az elem az (S , ·) félcsoportban invertál-
x eleme nullosztó, ha nem nulla, és egy
R-beli nem nulla y elemmel
102 •
3. Kriptográa
Test egy kommutatív, egységelemes gyur u, amelyben minden, a nullától különbözo elem invertálható.
3.3. példa.
<
Csoport, gyur u, test. Legyen 1
k
∈ N.
A
Zk = {0, 1, . . . , k − 1}
halmaz az egész
számok modulo k tekintett összeadásával véges csoport, amiben semleges elem a 0.
Zk
a modulo k
vett összeadással és szorzással kommutatív egységelemes gyur u (lásd a 3. 3-1. feladatot). Abban az
Z p a modulo k tekintett összeadásra és szorzásra test. ∗ Legyen lnko(n, m) az n és m számok legnagyobb közös osztója. Legyen 1 < k ∈ N esetén Zk = ∗ 1 ≤ i ≤ k és lnko(i, k) = 1}. A számok modulo k vett szorzásával Zk véges csoport az 1 semleges
esetben, ha p prímszám, akkor
{i
elemmel.
egyértelmuen Ha a szövegösszefüggésbol kiderül, hogy valamely G a
◦
= (S , ◦) csoportban Z∗k csoport
a muvelet, akkor nem szükséges explicit módon megadni. A 3.3. példabeli
fontos szerepet játszik a 3.3. alfejezetben, ahol az RSA kriptorendszert mutatjuk be. Ennek a csoportnak a rendjét az Euler-féle
ϕ
függvény adja meg, vagyis
ϕ(k) = |Z∗k |. ϕ
alábbi
tulajdonságai a deníció következményei:
• •
ϕ(m · n) = ϕ(m) · ϕ(n) minden m, n ∈ N esetén, ha lnko(m, n) = 1 és ϕ( p) = p − 1 minden p prímszámra.
Ezeknek a tulajdonságoknak a bizonyítását az Olvasóra hagyjuk (lásd a 3.1-3. gyakorlatot). a tulajdonságokból Foként a 3.3.1. pontban használjuk az alábbi állítást, amely ezekbol közvetlenül következik. 3.3. állítás. Ha n
=
p
· q, ahol
p és q különbözo prímszámok, akkor
ϕ(n) = ( p − 1)(q − 1).
G csoport minden a elemére és az e = e összefüggés, ahol |G| a csoport rendjét jelöli. Az alábbi, ∗ úgynevezett Euler-tétel ennek speciális esete (a Zn csoportra). Az Euler-tétel speciális esete A Lagrange-tétel szerint egy véges, multiplikatív
|G|
semleges elemre fennáll az a
pedig, ha n prímszám, és a-nak nem osztója, 3.4. tétel (Euler). Minden a
∈ Z∗n
ϕ(n)
esetén a
kis Fermat-tételként lett ismert.
≡ 1 mod n.
3.5. következmény (kis Fermat-tétel). Ha p prímszám és a
∈ Z∗p , akkor a p−1 ≡ 1 mod
p.
A 4.4. alfejezetben grázomorzmus problémára mutatunk algoritmusokat. Ez a probléma, amely a 3.5.2. pontban található zéró-ismeretu protokollnál fontos szerepet játszik, bizonyos csoportelméleti problémák speciális eseteként is felfogható. Különösen fontosak itt a permutációcsoportok. 3.6. deníció (permutációcsoport).
•
≥ 1 természetes = {1, 2, . . . , n}. Az [n] összes permutációinak halmazát Sn jelöli. a π ∈ Sn permutációt n darab [n] × [n]-beli (i, π(i)) rendezett
Egy permutáció valamely halmaz bijektív leképezése önmagára. Egy n szám esetén legyen [n] Algoritmikus célokra
párból álló listával reprezentáljuk.
•
Sn -en permutációk kompozíciójaként deniálunk egy muveletet, akkor Sn csoport π és τ Sn -beli permutációk, akkor πτ kompozíciójuk az az Sn -beli permutáció, amelyet úgy kapunk, hogy eloször π-t, azután τ-t alkalmazzuk [n] elemeire, tehát Ha
lesz. Ha
103
3.1. Alapok
(πτ)(i)
= τ(π(i))
∈
minden i
[n] esetén. Az
Sn
permutációcsoport semleges eleme az
= i minden i ∈ [n] Sn -nek azt a részcsoportját, amely csupán az id elemet tartalmazza, id jelöli.
identikus permutáció, amelyet a következoképpen deniálunk: id(i) esetén.
•
Sn -nek valamely T részhalmaza esetén a T által generált hTi permutációcsoportot Sn legszukebb olyan részcsoportjaként deniáljuk, amely T-t tartalmazza. Az Sn valamely G részcsoportját az ot generáló halmazzal reprezentáljuk, amelyet G generátorrendszerének is nevezzük. G-ben valamely i ∈ [n] elem pályáját G(i) = {π(i) | π ∈ G} deniálja.
•
[n] valamely T részhalmaza esetén elemét önmagára képezi. Ha i
≤
STn
n és
Sn -nek az a részcsoportja, amelyik T minden Sn részcsoportja G, akkor [i] G-beli (ponton-
az
kénti) stabilizátorát az alábbi módon deniáljuk:
G(i) = {π ∈ G | π( j) = A
•
∈ [i] esetén} .
G(n) = id és G(0) = G összefüggések fennállnak. G
Legyenek
H
j minden j
és
H
permutációcsoportok, és
jobb oldali mellékosztálya
vagy diszjunkt. Emiatt a
G
G-ben. H
H ≤ G. τ ∈ G
esetén
Hτ = {πτ | π ∈ H} G-ben azonos,
két jobb oldali mellékosztálya
permutációcsoportot
H G-beli
jobb oldali mellékosztályai
osztályozzák:
G = Hτ1 ∪ Hτ2 ∪ · · · ∪ Hτk .
(3.3)
H mindegyik G-beli jobb oldali mellékosztályának a számossága |H|. A {τ1 , τ2 , . . . , τk } (3.3) halmazt H G-beli jobb oldali reprezentánsrendszerének nevezzük. A pontonkénti stabilizátor fogalma különösen fontos olyan algoritmusok tervezésénél, amelyek permutációcsoportokkal dolgoznak. Az a lényeges struktúra, amelyet ilyenkor használunk azt úgy nevezzük, hogy id
G permutációcsoportbeli stabilizátor lánc:
= G(n) ≤ G(n−1) ≤ · · · ≤ G(1) ≤ G(0) = G .
G(i) -nek G(i−1) -ben teljes jobb oldali reprezenSn−1 tánsrendszere. Ekkor azt mondjuk, hogy T = Ti eros generátora G-nek, és G = hTi. i= 1 Ekkor minden π ∈ G egyértelmuen faktorizálható π = τ1 τ2 · · · τn alakban, ahol τi ∈ Ti . A Minden i-re 1
≤
i
≤
n esetén legyen
Ti
a
permutációcsoportokra vonatkozó alábbi algoritmuselméleti eredmények hasznosak lesz nek késobb, a 4.4. alfejezetben. 3.7. tétel. Ha a
G ≤ Sn
permutációcsoport a generátorrendszerével adott, akkor fennáll a
következo: 1.
Minden i
2.
Az id
∈ [n] esetén i G(i) pályája G-ben polinomiális ido alatt kiszámítható.
= G(n) ≤ G(n−1) ≤ · · · ≤ G(1) ≤ G(0) = G
stabilizátorlánc kiszámítható n-ben
polinomido alatt, ami azt jelenti, hogy meghatározzuk minden i, 1 teljes jobb oldali reprezentánsrendszerét rendszerét.
Ti -t G
(i−1)
-ben és ezzel
≤
i
≤
n esetén
G(i)
G egy eros generátor-
104
3. Kriptográa
Azokat a fogalmakat, amelyeket a 3.6. denícióban vezettünk be a permutációcsoporttal vett konkrét példák alapján fogjuk megvilágítani. Elso kapcsolatban, most a gráfelméletbol sorban gráfok automorzmuscsoportját és izomorzmuscsoportját vizsgáljuk. Ehhez szükségünk lesz néhány gráfelméleti fogalomra. 3.8. deníció (gráfok izomorzmusa és automorzmusa).
Egy G gráf egy véges V (G)
csúcshalmazból, és egy véges E(G) élhalmazból áll, melyben lévo élek bizonyos csúcsokat összekötnek egymással. Feltesszük, hogy nincsenek párhuzamos- és hurokélek. Ebben az alfejezetben kizárólag irányítatlan gráfokat vizsgálunk, ami azt jelenti, hogy az éleknek nincs irányításuk és rendezetlen csúcspárokként foghatjuk fel oket. Két gráf, G és H, disz-
∪ H-t, amelyek V (G) és V (H) csúcshalmazai átnevezéssel diszjunkttá ∪ V (H) csúcshalmazzal és az E(G) ∪ E(H) élhalmazzal deniáljuk.
junkt egyesítését, G tehetok, a V (G)
Legyen G és H két gráf ugyanannyi csúccsal. G és H közötti izomorzmus G csúcshalmazáról H csúcshalmazára képezo éltartó bijekció. Állapodjunk meg abban, hogy V (G)
{1, 2, . . . , n} = V (H). Ekkor tehát G és H pontosan akkor izomorf (röviden G olyan π ∈ Sn permutáció, hogy minden i, j ∈ V (G) csúcsra fennáll a következo: { i, j} ∈
E(G)
⇐⇒ {π(i), π( j)} ∈
E(H)
=
H), ha van
.
(3.4)
G egy automorzmusa G csúcshalmazának önmagára való éltartó bijekciója. Minden gráf esetén fennáll az id triviális automorzmus. Jelöljük Iso(G , H)-val a G és H közötti összes izomorzmus halmazát, Aut(G)-vel pedig G összes automorzmusának halmazát. A gráfizomorzmus problémát (röviden
GI)
és a gráfautomorzmus problémát (röviden
GA)
a
következo módon deniáljuk:
GI GA
= {(G, H) | G és H izomorf gráfok} ; = {G | G tartalmaz nem triviális automorzmust} .
Algoritmikus célokra a gráfokat vagy csúcs- és él-listájukkal, vagy csúcsmátrixukkal reprezentáljuk, amelyben az (i, j) helyen 1 áll, ha {i, j} egy él a gráfban, különben pedig 0. Valamely gráfnak ehhez az eloállításához elegendo a
Σ = {0, 1}
ábécével való kódolás. Ha
gráfpárokat kívánunk szemléltetni, akkor olyan bijektív párosítási (·, ·) függvényt alkalmazunk, amely
Σ∗ × Σ∗ -ról Σ∗ -ra képez, polinomiális idoben kiszámítható, és van polinomiális
idoben kiszámítható inverze.
3.4. példa. (Gráfok izomorzmusa és automorzmusa.) A 3.5. ábrán látható G és H gráfok izomorfak. Egy
π
→
: V (G)
V (H) izomorzmus, amelynél (3.4)-nek megfeleloen adjuk meg a csúcsok
módon: szomszédosságát, megadható például a következo
π=
π =
1 2 3 4 5
(3
4 1 5 2
), illetve ciklikus módon írva
(1 3)(2 4 5). G és H között van még három további izomorzmus, és így |Iso(G , H)|
=
4, (lásd a
3.1-4. gyakorlatot). G és H azonban nem izomorfak F-fel. Ez azonnal látható, ha a fokszámok soro élek számát). A G-hez, illetve H-hoz zatát nézzük (vagyis minden csúcs esetén a csúcsra illeszkedo tartozó sorozat különbözik az F-hez tartozótól: G és H esetén ez a sorozat (2, 3, 3, 4, 4), miközben F esetén (3, 3, 3, 3, 4). G egy nem triviális
ϕ
: V (G)
→
ϕ=( ), il) illetve τ = (1)(2)(3 4)(5) 1 2 3 4 5
V (G) automorzmusa például
2 1 4 3 5
ϕ = (1 2)(3 4)(5) segítségével adható meg, egy másik pedig τ = ( segítségével. G-nek van még két további automorzmusa és így |Aut(G)| = 4 (lásd a 3.1-4. gyakorla1 2 3 4 5
letve
1 2 4 3 5
tot). Az Iso(G , H), Aut(F), Aut(G) és Aut(H) permutációcsoportok (5)
Aut(G)
≤
(4)
Aut(G)
≤ ··· ≤
(1)
Aut(G)
≤
(0)
Aut(G)
S5
részcsoportjai. Aut(G)-ben az (5)
stabilizátorlánc az Aut(G)
=
(4)
Aut(G)
=
105
3.1. Alapok
F
1
2
3
5
4 G
H
5
3
2
1
4 3
1
2
5
4
3.5. ábra. A három gráf: G és H izomorfak, de F nem izomorf velük.
Aut(G)
(3)
=
(2)
id, Aut(G)
=
= h{id, τ}i
(1)
Aut(G)
és Aut(G)
(0)
=
Aut(G) részcsoportokból áll. G
automorzmuscsoportjában, Aut(G)-ben az 1 és 2 csúcsok pályája
{1, 2},
a 3 és 4 csúcsok pályája
{3, 4}, és az 5 pályája {5}. Az Iso(G , H) és Aut(G) permutációcsoportok rendje pontosan akkor azonos, ha G és H izomorfak. Ha ugyanis G és H izomorfak, akkor |Iso(G , H)| hogy Aut(G)
=
Iso(G , G). Másrészt ha G
= |Aut(G)|
következik abból,
H, akkor Iso(G , H) üres, ugyanakkor Aut(G)-
következik a 3.9. lemma (3.5) ben mindig benne van az id triviális automorzmus. Ebbol állítása, amire késobb a 4.4. alfejezetben szükségünk lesz. A (3.6) igazolására tegyük fel, esetben G illetve H helyett a G illetve H komplemenhogy G és H összefüggoek; ellenkezo ter gráfokat tekintjük, (lásd a 3.1-5. gyakorlatban). G
∪
H egy automorzmusa, amely G
és H csúcsait felcseréli, egy Iso(G , H)-beli és egy Iso(H, G)-beli izomorzmusból tevodik össze. Így |Aut(G
(3.5) felhasználásával ∪ H)| = |Aut(G)| · |Aut(H)| + |Iso(G, H)|2 , amibol
következik (3.6). 3.9. lemma. Bármely két G és H gráf esetén fennállnak a következok:
( |Iso(G, H)| = ( |Aut(G ∪ H)| = Ha G és H izomorf gráfok, és
|Aut(G)| = |Aut(H)|, 0, · |Aut(G)| · |Aut(H)|, |Aut(G)| · |Aut(H)|, 2
τ ∈
ha G
ha G ha G
H
(3.5)
H ;
H H
.
(3.6)
Iso(G , H), akkor Iso(G , H)
lenti, hogy Iso(G , H) Aut(G)-nek jobb oldali mellékosztálya mellékosztály azonos, vagy diszjunkt,
ha G
= Aut(G)τ. Ez azt jeSn -ben. Mivel két jobb oldali
Sn (3.3) szerint Aut(G) jobb oldali mellékosztályaira
bomlik:
Sn = Aut(G)τ1 ∪ Aut(G)τ2 ∪ · · · ∪ Aut(G)τk ,
(3.7)
106
3. Kriptográa
ahol |Aut(G)τi |
= |Aut(G)| minden i, 1 ≤ i ≤ k esetén. Ezek szerint az Sn permutációiból {τ1 , τ2 , . . . , τk } halmaz Aut(G)-nek Sn -beli jobb oldali reprezentánsrendszerét alkotja. Ha π(G) azt a H G gráfot jelöli, amelyet akkor kapunk, ha a π ∈ Sn permutációt G csúcsaira alkalmazzuk, akkor {τi (G) | 1 ≤ i ≤ k} = { H | H G }. Mivel Sn -ben pontosan következik: n! = n(n − 1) · · · 2 · 1 permutáció van, (3.7)-bol álló
|{H | H G}| = k =
|Sn | n! = . |Aut(G)| |Aut(G)|
Ezzel beláttuk az alábbi következményt. 3.10. következmény. Ha a G gráfnak n csúcsa van, akkor pontosan n!/|Aut(G)| vele izomorf gráf van. G gráffal így pontosan 5!/4 A 3.4. példa 3.5. ábráján lévo
=
30 gráf izomorf. A következo
lemmára késobb, a 4.4. alfejezetben lesz szükségünk. 3.11. lemma. Legyenek G és H n csúcsú gráfok. Deniáljuk az alábbi halmazt: A(G , H)
=
{(F, ϕ) | F G és ϕ ∈ Aut(F)} ∪ {(F, ϕ) | F
H és
ϕ ∈ Aut(F)}.
Ekkor fennáll a következo:
( |A(G, H)| =
n!,
ha G
2n!,
ha G
Bizonyítás. Ha F és G izomorfak, akkor |Aut(F)|
H H.
= |Aut(G)|.
A 3.10. következménybol
adódik, hogy
|{(F, ϕ) | F G és ϕ ∈ Aut(F)}| = és hasonlóan megmutatható az is, hogy
|{(F, ϕ) |
n!
|Aut(F)| F
H és
· |Aut(F)| = n!, ϕ ∈ Aut(F)}| =
n!. Ha G és H
izomorfak, akkor
{(F, ϕ) | F G és ϕ ∈ Aut(F)}
= {(F, ϕ) | F
H és
ϕ ∈ Aut(F)} .
következik, hogy | A(G , H)| = n!. Ha pedig G és H nem izomorfak, akkor Ebbol {(F, ϕ) | F G és ϕ ∈ Aut(F)} és {(F, ϕ) | F H és ϕ ∈ Aut(F)} diszjunkt halmazok. Eszerint | A(G , H)| = 2n!.
Gyakorlatok 3.1-1. A 3.6. ábrán láthatunk két elfogott rejtjelezett szöveget, c1 -et és c2 -t. Tudjuk, hogy ugyanannak az m nyílt szövegnek a rejtett változata, és az egyik eltolásos rejtjelemindketto zovel, a másik pedig Vigenère-rejtjelezovel lett sifrírozva. Mindkét szöveget fejtsük vissza. módszernél egy Útmutatás. A visszafejtés után megállapítható, hogy az egyik rejtjelezo igaz, a másiknál egy hamis állítás adódik. Van esetleg értelme gyakorisági elemzést alkalmazni?
107
3.2. Kulcscsere Diffie és Hellman szerint
c1
W K L V V H Q W H Q F H L V H Q F U B S W H G E B F D H V D U V N H B
c2
N U O S J Y A Z E E W R O S V H P X Y G N R J B P W N K S R L F Q E P 3.6. ábra. Ugyanannak a nyílt szövegnek két rejtett változata a 3.1-1. gyakorlatban.
Z a szokásos összeadással és szorzással nullosztómentes gyur u. Z test? Mit mondhatunk az (N, +), (N, ·) és (N, +, ·) algebrai struktúrák tulajdonsága-
3.1-2. Mutassuk meg, hogy Vajon iról?
ϕ-függvény alábbi tulajdonságait: ϕ(m · n) = ϕ(m) · ϕ(n) minden m, n ∈ N esetén, ha lnko(m, n) = 1. b. ϕ( p) = p − 1 minden p prímszám esetén.
3.1-3. Bizonyítsuk be az Euler-féle a.
Ezeknek a tulajdonságoknak a segítségével bizonyítsuk be a 3.3 állítást. 3.1-4. Adottak az F, G és H gráfok a 3.5. ábrán. a. Határozzuk meg a G és H közötti összes izomorzmust. b. Határozzuk meg F, G és H összes automorzmusát. c. A G és H közötti melyik izomorzmus esetén lesz Iso(G , H) Aut(G)-nak jobb oldali mellékosztálya
S5 -ben,
vagyis melyik
τ ∈
Iso(G , H) esetén lesz Iso(G , H)
Határozzuk meg Aut(F), Aut(G) és Aut(H) jobb oldali reprezentánsrendszerét
= Aut(G)τ? S5 -ben.
d. Határozzuk meg F minden csúcsának pályáját Aut(F)-ben és H minden csúcsának pályáját Aut(H)-ban. e. Határozzuk meg az Aut(F)
≤ S5 és Aut(H) ≤ S5 részcsoportok stabilizátorláncát.
f. Hány 5 csúcsú gráf izomorf F-fel? 3.1-5. Valamely G gráf komplementer gráfját a következoképpen deniáljuk: a csúcshalmaza V (G)
= V (G), az élhalmaza pedig E(G) = {{i, j} | i, j ∈ V (G) és {i, j} <
E(G)}. Mutas-
suk meg, hogy: a. Aut(G)
= Aut(G). = Iso(G, H).
b. Iso(G , H)
ha G nem összefüggo. c. G összefüggo,
3.2. Kulcscsere Diffie és Hellman szerint Ebben az alfejezetben, valamint a következokben is szükségünk lesz a 3.1.3. pontban látott számelméleti alapfogalmakra. Elsosorban a 3.3. példabeli Euler-féle
Z∗k
multiplikatív csoportra és az
ϕ függvényre gondolunk; a maradékosztálygyur uk aritmetikáját a fejezet végén
fogjuk megvilágítani a 3-1. feladatban. A 3.7. ábra a kulcscserére vonatkozó DiffieHellman-protokollt mutatja. Ez a protokoll az r alapú, p modulusú moduláris exponenciális függvényen alapszik, ahol p prímszám és r primitív gyök modulo p. r 1
≤
d
<
∈ Z∗n
primitív gyök modulo n, ha r
d
.
1 mod n minden d,
ϕ(n) esetén. Egy r modulo n primitív gyök eloállítja az egész
∗
Z∗n
csoportot, ami
Zn = {r | 0 ≤ i < ϕ(n)}. Emlékeztetünk arra, hogy ha p prímszám, akkor a Z∗p multiplikatív csoport rendje ϕ( p) = p − 1. Z∗p -nak pontosan ϕ( p − 1) primitív gyöke van
azt jelenti, hogy
i
(lásd a 3.2-1. gyakorlatot is). 3.5. példa. Nézzük
Z∗5 = {1, 2, 3, 4}-et.
Mivel
Z∗4 = {1, 3},
így
ϕ(4) =
2, tehát a modulo 5 primitív Z∗5 -ot,
gyökök száma 2, modulo 5 primitív gyökök a 2 és a 3, így mind 2 mind 3 eloállítja az egész
108
3. Kriptográa
Lépés
Aliz
Erik
Bob
1
Aliz és Bob megállapodnak egy nagy p prímszámban, és egy r modulo p primitív gyökben; p és r nyilvánosak
2
véletlenszeruen választ egy nagy, tit-
véletlenszeruen választ egy nagy, tit-
kos a számot, és kiszámítja a követkea α = r mod p zot:
kos b számot, és kiszámítja a követke zot:
α⇒ ⇐β
3 4
kiszámítja kA
= βa
mod p értékét
β = rb
mod p
kiszámítja k B
= αb
mod p értékét
3.7. ábra. Diffie és Hellman szerinti kulcscserére vonatkozó protokoll.
mivel 2
0
3
0
= 1; = 1;
2
1
3
1
= 2; = 3;
2
2
3
2
= 4; ≡ 4 mod 5;
2
3
3
3
≡ 3 mod 5 ; ≡ 2 mod 5 .
Nem minden n számnak van modulo n primitív gyöke; a 8 a legkisebb ilyen példa. tudjuk, hogy valamely n számra pontosan akkor van modulo n Az elemi számelméletbol primitív gyök, ha n vagy {1, 2, 4}-nek eleme, vagy pedig n
=
=
k
q , illetve n
k
2q alakú, ahol
q páratlan prímszám. 3.12. deníció (diszkrét logaritmus). Legyen p prímszám és r egy modulo p primitív gyök. Az r alapú, p modulusú képez,
expr, p (a) =
r
a
expr, p
moduláris exponenciális függvényt, amely
mod p-vel deniáljuk. Az inverz függvényét diszkrét logaritmusnak
nevezzük, ez rögzített p és r esetén az logr
expr, p (a) mod
∗ Z p−1 -rol Z p -re
expr, p (a)
=
értéket a-ra képezi. Fennáll, hogy a
p.
A 3.7. ábra protokollja muködik, mert kA
= βa =
r
ba
=
r
ab
= αb =
k B miatt (modulo
p aritmetikával) Aliz valójában ugyanazt a kulcsot számolja ki, mint Bob. Ezt a kulcsot könnyen kiszámíthatják, mivel az
´ ´
expr, p
moduláris exponenciális függvény a M ´
algoritmussal hatékonyan meghatározható. Ezzel szemben Erik arra irányuló
törekvése, hogy a kulcsukat meghatározza, nehézségekbe ütközik, mert a diszkrét logaritmus igen nehéz problémának számít. Az
expr, p
moduláris exponenciális függvény így egy
lehetséges egyirányú függvény, olyan függvény, amelyik bár könnyen kiszámítható, de csak nehezen invertálható. Sajnos máig nem tudjuk, hogy van-e egyáltalán egyirányú függvény. S ami még inkább kár: jóllehet nem tudjuk, hogy van-e ilyen, a kriptográában az egyirányú függvények kulcsszerepet játszanak, mert sok kriptorendszer biztonsága azon a feltevésen alapszik, hogy egyirányú függvények valóban vannak. M - ´ (a, b, m) ´ ´ 1
B m a modulus, b < m az alap és a a kitevo
2
a kitevot kettes számrendszerben: a állítsuk elo 2
i
3
számoljuk ki egymás után a b
4
számoljuk ki modulo m aritmetikával b
=
értékeket, ahol 0 a
i
=
Qk
Pk
i= 0
i+1
i = 0 ai =1
b
2
i
6
return b
=
=
2
b
i
2
értékét.
B ha beleszámoltuk a szorzatba b2 -t, és kiszámítottuk b2
a
∈ {0, 1}.
≤ i ≤ k, felhasználva, hogy b2
5
A b
i
ai 2 , ahol ai
i+1
i
2
-t, akkor b -t kitörölhetjük
a
Qk i = 0 ai =1
2
b
i
kiszámítása helyes, mert a modulo m aritmetikában fennáll a követ-
.
109
3.2. Kulcscsere Diffie és Hellman szerint
kezo: a
b
Pk
=b
i=0
i
ai 2
=
k Y
2
b
i
a
i
=
i=0
Miért lehet hatékonyan kiszámítani az
k Y
2
b
i
.
i = 0 ai =1
expr, p (a) =
r
a
mod p hatványfüggvényt? Ha
mindegyik ezt a számítást naivan hajtjuk végre, sok szorzásra lehet szükségünk az a kitevo értékére. A M - ´ algoritmussal azonban Aliznak nem a ´ ´
− 1 szorzást kell
végeznie, mint a naiv módszernél, hanem csupán legfeljebb 2 log a szorzásra van szüksége. A M - ´ algoritmus egy exponenciális tényezovel gyorsítja a moduláris ´ ´ hatványozást. 3.6. példa. (M - ´ a DiffieHellman-protokollban.) Aliz és Bob a p ´ ´
= 5 prímszámot = 3-at, mint modulo 5 primitív gyököt választja. Aliz az a = 17 titkos számot választja. Mivel 17 Aliz Bobnak az α számot akarja küldeni, ki szeretné számítani az α = 3 = 129140163 ≡ 3 mod 5 0 4 bináris alakban felírva 17 = 1 + 16 = 2 + 2 . Aliz lépésenként számítja ki az értéket: számot. A kitevo és az r
0
2
3
= 3;
3
1
2
= 32 ≡ 4 mod 5; 17
kiszámítja a 3 Ebbol
≡
2
3
0
3
2
2
≡ 42 ≡ 1 mod 5; 4
· 32 ≡
3
·1 ≡
3
3
2
≡ 12 ≡ 1 mod 5;
3
2
4
≡ 12 ≡ 1 mod 5.
3 mod 5 értéket. Figyeljük meg, hogy Aliz ahelyett,
hogy 16-szor szorzott volna, csupán négyszer emelt négyzetre és egyszer szorzott határozása érdekében. Ha Bob saját magának a b
=
α=
3 mod 5 meg-
választja, akkor ugyanezzel az 23 titkos kitevot
β = 323 = 94143178827 ≡ 2 mod 5, végül 3.7. ábrán látható DiffieHellman-protokollal meghatározzák
részét, tehát eljárással ki tudja számítani a kulcs orá eso Aliz és Bob a közös titkos kulcsukat a
(lásd a 3.2-2. gyakorlatot). A protokoll biztonsága ebben az esetben természetesen nincs garantálva, hiszen p
=
5-tel nagyon kicsi prímszámot választottak; ez a játékpélda csak a könnyebb megértést
szolgálja.
Ha Erik gyelmesen lehallgatja Aliz és Bob társalgását, amely a 3.7. ábra szerinti DiffieHellman-protokoll szerint zajlik, akkor ismeri a p, r, szeretné meghatározni a kA bol
=
α
és
β
értékeket, amelyek-
k B titkos kulcsukat. Eriknek ezt a problémáját Diffie
= logr α mod p és = logr β mod p titkos számokat, akkor, akárcsak Aliz és Bob, ki tudná számolni a = βa mod p = αb mod p = kB kulcsot, és megoldaná a DiffieHellman-problémát. Ez
Hellman-problémának nevezik. Ha Erik meg tudná határozni az a a b kA
a probléma tehát nem nehezebb, mint a diszkrét logaritmus problémája. A fordított kérdés, hogy vajon a DiffieHellman-probléma legalább olyan nehéz-e, mint a diszkrét logaritmusé, tehát hogy ugyanolyan nehezek-e, ez máig csupán nem bizonyított sejtés. Mint sok más protokoll, a DiffieHellman-protokoll biztonságossága mindezidáig nem bizonyított. Mivel szerencsére eddig sem a diszkrét logaritmus, sem a DiffieHellman-probléma hatékonyan nem oldható meg, ez a közvetlen támadás nem jelent valóságos veszélyt. Másrészt azonban vannak más, nem közvetlen támadások, amelyeknél a kulcsot nem közvetlenül a DiffieHellman-protokollban átadott
α,
illetve
β
határozzák meg. Így értékekbol
például a DiffieHellman nem biztonságos a
középen állás támadással szemben. A fent leírt támadás passzív, ez pedig aktív abban az értelemben, hogy a támadó Erik nem elégszik meg a passzív hallgatózással, hanem megpróbálja a protokollt aktívan a saját ízlésé nek megfeleloen megváltoztatni. Úgyszólván beáll
α = ra mod p, és αE = rc mod p értékét
Aliz Bobnak küldött
középre, Aliz és Bob közé és elfogja b Bob Aliznak küldött β = r mod p üzenetét. α
β helyett saját továbbítja Bobnak, Aliznak pedig a szintén saját βE = rd mod p értéket, miközben Erik a titkos c és d értékeket maga választotta. Ha most és
110
3. Kriptográa
Lépés
Aliz
Erik
Bob
1
Véletlenszeruen választ két nagy prímszámot, p-t és q-t és kiszámítja az n = pq és ϕ(n) = ( p − 1)(q − 1)
értékeket, nyilvános (n, e) kulcsát, és d titkos kulcsát, 2 3
c
=
e
m
⇐ (n, e)
amelyek megfelelnek (3.8) és (3.9)-nek
mod n szerint
rejtjelezi m-et 4
c
⇒
5
visszafejti c-t m
= cd
mod n szerint
3.8. ábra. Az RSA-protokoll.
Aliz a kA
= (β E )a
mod p értéket kiszámítja, kA valójában ezentúl nem a Bobbal mint
ahogy azt Aliz hiszi , hanem az Erikkel való kommunikáció kulcsa, mert Erik ezt a kulcsot (modulo p aritmetikával): kE ugyanúgy értékeli ki, mint ok
= αd =
r
ad
=
r
da
= (βE )a =
kA
segítségével. Ugyanígy lefolytathat Erik egy észrevehetetlen kulcscserét Bobbal, és a jö voben vele kommunikálhat anélkül, hogy ezt Bob sejtené. A hitelességnek ezzel a problé májával késobb fogunk alaposabban foglalkozni a zéró-ismeretu protokollokról szóló 3.5. alfejezetben.
Gyakorlatok
Z∗13 -ban, illetve Z∗14 -ban? ∗ valamint Z14 összes primitív gyökét,
3.2-1. a. Hány primitív gyök van b. Határozzuk meg
∗
Z13
és bizonyítsuk be, hogy
ezek valóban primitív gyökök. hogy a teljes c. Mutassuk meg az összes modulo 13, illetve modulo 14 primitív gyökrol, Z∗13 -ot, illetve a teljes Z∗14 -ot eloállítják. 23 3.2-2. a. Határozzuk meg a β = 3 = 94143178827 ≡ 2 mod 5 értéket (Bob 3.6. példabeli értékét) a M - ´ algoritmussal. ´ ´ b. Határozzuk meg a 3.6. példában az α és β számokhoz Aliz és Bob közös titkos kulcsát DiffieHellman-protokoll szerint. a 3.7. ábrán lévo
3.3. RSA és faktorizálás 3.3.1. RSA Az RSA-kriptorendszer, amelyet három feltalálójáról, Ron Rivest, Adi Shamir és Leonard ismert nyilvános kulcsú kriptorendszer. Manapság is igen Adleman-ról neveztek el, az elso népszeru, és sok kriptográai alkalmazásba beillesztik. A 3.8. ábrán összefoglaltuk az RSA protokoll egyes lépéseit, amelyeket végül részletesen is leírunk, valamint lásd a 3.7. példát. Kulcsgenerálás. Bob választ véletlenszeruen két nagy prímszámot, p-t és q-t úgy, hogy p
,
q, és kiszámítja n
=
pq szorzatukat. Azután választ egy e
∈ N
az alábbiak kitevot
szerint 1
< e < ϕ(n) = ( p − 1)(q − 1)
majd meghatározza e mod 1
és
lnko(e, ϕ(n))
=1,
(3.8)
ϕ(n) inverzét, vagyis azt az egyértelmu d számot, amelyre: < d < ϕ(n)
és
e
· d ≡ 1 mod ϕ(n).
(3.9)
111
3.3. RSA és faktorizálás
Az (n, e) pár Bob nyilvános kulcsa, d pedig Bob titkos kulcsa. Rejtjelezés. Mint már a 3.1. alfejezetben is, az üzenetek egy blokkonként, állandó hosszúságú blokkhosszal
|Σ|-adikus
Σ
ábécé feletti szavak és
természetes számokként kódol-
juk oket. Ezeket a számokat azután rejtjelezzük. Legyen m
<
n az üzenet egyik rejtjelezett
szám, amelyet Aliz szeretne Bobnak küldeni. Aliz ismeri Bob nyilblokkjának megfelelo vános (n, e) kulcsát, és m-et rejtjelezi c
=
függvény E (n,e) (m) számként, ahol a rejtjelezo
deníciója az alábbi: E (n,e) (m) Visszafejtés. Legyen c, 0
≤
c
<
= me
mod n
.
n az a szám, amely a rejtjelezett szöveg egyik blokk-
jának kódja, amelyet Bob megkap, Erik pedig lehallgatja. Bob desifrírozza c-t a d titkos függvény segítségével: kulcsa és az alábbi visszafejto Dd (c)
= cd
mod n
.
Azt, hogy az RSA-módszer valóban kriptorendszer a 3.1. deníció értelmében, a 3.13. tétel állítja. Ennek a tételnek a bizonyítását az Olvasóra hagyjuk (lásd a 3.3-1. gyakorlatot). 3.13. tétel. Legyenek (n, e) a nyilvános, d a titkos kulcsok az RSA-protokollban. Ekkor minden m, 0
≤
m
<
n üzenet esetén m
=
e d
(m )
mod n. Így az RSA (nyilvános kulcsú) kripto-
rendszer. Az RSA-eljárás hatékonysága érdekében megint a M - ´ algoritmust ´ ´ használjuk a gyors-hatványozásra. Hogyan válasszuk meg a 3.8. ábrán bemutatott RSA pro tokollban a p és q prímszámokat? Eloször is elég nagyoknak kell lenniük, egyébként Erik az n számot Bob nyilvános (n, e) kulcsában faktorizálná, és n p és q prímfaktorait meghatározná, így a kiterjesztett euklideszi algoritmussal könnyen meghatározhatná Bob d titkos kulcsát, amely e mod
ϕ(n) egyértelmu inverze, ahol ϕ(n) =
(p
− 1)(q − 1). A
p és q prím-
számoknak titkosaknak kell maradniuk, s ezért elegendoen nagyoknak kell lenniük. A gya kell tehát korlatban p-t és q-t mindig legalább 80 decimális jegyunek kell választani. Elo állítani ilyen nagyságú véletlen számokat, és tesztelni kell egy ismert véletlen prímteszttel, hogy vajon valóban prímek-e. Mivel a prímszámok elmélete szerint körülbelül N / ln N Nnél kisebb prímszám van, nagy a valószínusége annak, hogy nem túl sok próbálkozás után prímszámra akadjunk. hogy p és q prímek-e. Elméletileg determinisztikusan polinomiális idoben eldöntheto, eredményt publikálták, hogy a Agrawal, Kayal és Saxena a közelmúltban azt a meglepo
PRIMES = {bin(n) | n prím} prímszámprobléma a P bonyolultsági osztályba tartozik. Ez az áttörés megoldotta a bonyolultságelmélet régóta nyitott problémáját, mert a grázomorzmus probléma mellett a prímszámprobléma tunt olyannak, amely se nem P-beli, se nem 3
NP-teljes.
12
Bár az algoritmus futási idejének eredeti O(n
6
) korlátját azóta O(n )-ra
javították, az algoritmus a gyakorlati alkalmazások számára nem elég gyors. algoritmusa, amely Miller deterA legkedveltebb véletlen prímteszt Rabin következo minisztikus algoritmusának elvére épül.
3
A P és NP bonyolultsági osztályokat a 4.1. alfejezetben deniáljuk, az NP-teljességet pedig a 4.2. alfejezetben.
112
3. Kriptográa
MR(n) 1 2 3 4
− 1 = 2k m átalakítást, ahol m és n páratlanok válasszunk véletlenszeruen egy z ∈ {1, 2, . . . , n − 1} számot egyenletes eloszlással m számítsuk ki az x = z mod n értéket if x ≡ 1 mod n
végezzük el az n
5
then return
6
else for j
n prímszám és álljunk meg
7
← 0 to k − 1 if x ≡ −1 mod n
8
then return
9
else x
10
←
x
n prímszám
2
mod n;
return
n nem prímszám
A MR teszt úgynevezett Monte-Carlo-algoritmus,
nem válasza megbíz A MillerRabinigen válasza azonban egy bizonyos hibavalószínuséggel értendo. 3 O(n ) idoben teszthez hasonló Solovay és Strassen prímtesztje. Mindketto dolgozik. A
ható,
SolovayStrassen-teszt azonban kevésbé népszeru, mert a gyakorlatban nem olyan hatékony, mint a MillerRabin-teszt és kevésbé pontos. Azon problémák osztályának, amelyek a Monte-Carlo-algoritmussal mindig megbízható
igen válasszal oldódnak meg, külön nevük van: RP, a Randomized Polynomial Time származó betuszó. kifejezésbol A komplementer osztály, coRP = { L | L ∈ RP}, mindazokat a
problémákat tartalmazza, amelyekre a Monte-Carlo-algoritmus mindig megbízható nem választ ad. RP-t formálisan a nemdeterminisztikus polinomiális ideju Turing-gépekkel de niáljuk (röviden NPTM; lásd a 4.1. alfejezetet és foként a 4.1., 4.2. és 4.3. deníciókat), amelyeknek a muködése véletlen folyamatként fogható fel: minden nemdeterminisztikus két elágazás mindeelágazásnál a gép úgymond pénzfeldobással muködik, és a következo gyike 1/2 valószínuséggel következik be. Az NPTM-ben megvalósuló utak száma szerint minden bemeneti adathoz tartozik egy bizonyos megvalósulási valószínuség, ahol hibák is felléphetnek. RP deníciója megkívánja, hogy az elfogadott bemeneti értékek esetén a hibavalószínuség soha nem lehet nagyobb 1/2-nél, miközben az elutasított bemenetek esetén egyáltalán nem léphet fel hiba. 3.14. deníció (randomizált polinomiális ido). Az RP osztály pontosan azokat az A problémákat tartalmazza, amelyekhez van olyan NPTM M, hogy M mindegyik x 1/2 valószínuséggel fogadja el, x 3.15. tétel. A
<
∈
A-t legalább
A-t pedig 0 valószínuséggel fogadja el.
PRIMES a coRP ben van.
A fenti tétel azt mondja, hogy a MillerRabin-teszt a prímszámproblémára MonteCarlo-algoritmus. A bizonyítást itt csak vázoljuk. Megmutatjuk, hogy a MillerRabin-teszt
PRIMES-t
egyoldalú hibavalószínuséggel fogadja el: ha a (binárisan eloállított) n bemeno
érték prímszám, akkor az algoritmus nem válaszolhatja tévesen azt, hogy n nem prímszám. Hogy ellentmondásra jussunk, tegyük fel, hogy n prím, de a MillerRabin-teszt azzal a n nem prímszám. Következésképpen z . 1 mod n áll fenn. Mik −1 m 2m 2 m vel x-et a for ciklus minden lefutásakor négyzetre emeljük, modulo n a z , z , . . ., z m
kimenettel áll le, hogy
egymás utáni értékeket vizsgáljuk. Ezen értékek egyikénél sem válaszolja azt az algoritmus, j
2 m
következik, hogy z hogy n prím. Ebbol
. −1 mod n minden
j, 0
≤ j ≤ k − 1 esetén. Mivel
113
3.3. RSA és faktorizálás
Üzenet
R S
A I
S T
H E
K E
Y T
O P
U B
L I
C K
E Y
C R
Y P
T O
G R
A P
H Y
mb
460
8
487
190
264
643
379
521
294
62
128
69
641
508
173
15
206
cb
697
387
206
449
165
724
631
365
189
600
325
262
332
472
354
665
673
rejtjelezésre. 3.9. ábra. Példa RSA-val történo
n
k
2 m z − 1 = 2k m, a kis-Fermat-tételbol ≡ 1 mod n következik (lásd a 3.5. következményt). 2
Ezért z
k−1
m
1 négyzetgyöke modulo n. Mivel n prím, 1-nek modulo n csak két négyzet-
2
tehát z
k −1
±1 mod n,
k −1
. −1 mod n miatt ≡ 1 mod n teljesül. De ekkor megint z 1-nek négyzetgyöke modulo n. Mint − 2 m megint z fent, ebbol ≡ 1 mod n következik. Ezt a érvet ismételten alkalmazva végül m azt kapjuk, hogy z ≡ 1 mod n, ami ellentmondás. Következésképpen a MillerRabin-teszt
gyöke van, nevezetesen a
(lásd a 3.3-2. gyakorlatot). z
m
2
k−2
2
m
m
k 2
minden prímszám esetén helyes választ ad. Ha n nem prímszám, akkor megmutatható, hogy a MillerRabin-teszt valószínusége nem lépi túl az 1/4 küszöböt. Ismételt független teszt kárára, ami mindamellett log n-ben futtatásokkal azt kapjuk, természetesen a futási ido polinomiális marad hogy a hibavalószínuség tetszolegesen közel kerül nullához. RSA. Bob a p = 67 és q = 11 prímszámokat választja. Így n = 67 · 11 = 737 és − 1)(q − 1) = 66 · 10 = 660. Ha most Bob a ϕ(n) = 660-hoz a leheto legkisebb kitevot nyilvános kulcsa az (n, e) = (737, 7) pár. A kiterjesztett euklideválasztja, ami e = 7, akkor az o szi algoritmus Bobnak a d = 283 titkos kulcsot szolgáltatja, és fennáll e · d = 7 · 283 = 1981 ≡ 1 mod 660 (lásd a 3.3-3. gyakorlatot). Amint a 3.1. alfejezetben is tettük, a Σ = {A, B, . . . , Z} ábécét a Z26 = {0, 1, . . . , 25} halmazzal azonosítjuk. Az üzenetek a Σ fölötti szavak, és azonos hosszú-
3.7. példa.
ϕ(n) =
(p
ságú blokkonként 26-os számrendszerben eloállított számokként kódoljuk. Példánkban a blokkhossz
` = blog26 nc = blog26 737c = 2. Egy b = b1 b2 · · · b` blokkot, amelynek a hossza `, és bi ∈ Z26 , ábrázolja. Az ` = blog26 nc blokkhossz deníció következtében:
0
≤ mb ≤ 25 ·
` X
`−i
26
az mb
=
P`
i=1
bi
·
26
`−i
szám
= 26` − 1 < n.
i=1
függvénnyel a b blokkot, illetve a megfelelo mb számot cb Az RSA rejtjelezo rejtett szöveg ekkor cb sifrírozzuk. A b blokknak megfelelo az
`
hosszúságú blokkokat injektíven képezi le
`+1
=
e
(mb ) mod n szerint
= c0 c1 · · · c` , ahol ci ∈ Z26 . Az RSA tehát
hosszúságú blokkokra. A 3.9. ábrán láthatjuk,
hogy egy 34 hosszú üzenetet 17 darab 2 hosszú blokkba tördeltünk és az egyes blokkokat számokként blokkot, amely rejtjeleztük. Például az elso
RS, számmá transzformáltuk a következoképpen:
· 261 + 18 · 260 = 442 + 18 = 460. eloállíthatjuk 26-os számrendszerben és ` +
nek a 17 és
S-nek a 18 felel meg, és 17
R-
A kapott cb számot megint 1 lehet a hossz: cb `−i blokk 697 = 676 + 21 c · 26 , ahol ci ∈ Z26 (lásd a 3.3-3. gyakorlatot is). Így az elso i=0 i
P` 1
· 262 + 0 · 261 + 21 · 260 , a rejtjelezett szövegben
BAV lett belole. blokkot a d A visszafejtés is blokkonként történik. Ahhoz, hogy az elso
697 visszafejtsük, kiszámoljuk a következot:
´ ´
283
0
=
283 titkos kulccsal
mod 737, ismét gyors-hatványozással, a M ´
algoritmus segítségével. Azért, hogy a számok ne legyenek nagyon nagyok, ajánlatos
= 737 redukálni a kapott értékeket. + 21 + 23 + 24 + 28 , és amint kívántuk adódik a következo:
minden szorzásnál modulo n 2
= =
283
697
0
1
3
4
8
bináris kifejtése 283 A kitevo
≡ 6972 · 6972 · 6972 · 6972 · 6972 ≡ 697 · 126 · 9 · 81 · 15 ≡ 460 mod 737.
=
114
3. Kriptográa
Lépés 1
Aliz
Erik
protokollban
(n, e)
2 3
Bob
értékeket választja: n = pq, A következo (n, e) nyilvános kulcs és d titkos kulcs, RSAahogyan Bob tette a 3.8. ábrán lévo
Aláírja az m üzenetet: sigA (m)
=
d
m
⇒
mod
n
(m, sigA (m))
4 5
⇒ Aliz aláírását m Ellenorzi sigA (m)
e
≡
mod n segítségé-
vel 3.10. ábra. Digitális aláírás RSA-val.
3.3.2. Digitális aláírás RSA segítségével RSA nyilvános kulcsú kriptorendszer módosítható úgy, hogy protoA 3.8. ábrán szereplo od kollként digitális aláírásra alkalmas legyen. Ilyet mutattunk be a 3.10. ábrában. Meggyoz hetünk arról, hogy a protokoll muködik (lásd a 3.3-4. gyakorlatot). Ez a protokoll érzékeny nyílt szöaz olyan támadásra, amelynél a támadó maga meg tudja választani a rejtjelezendo veget (választott szövegu támadás,
chosen-plaintext attacks).
3.3.3. Az RSA biztonsága és lehetséges támadások az RSA ellen mértékben attól függ, hogy nagy számok Már említettük, hogy az RSA biztonsága dönto nem könnyen faktorizálhatók. Mivel elszánt keresés ellenére sem sikerült ezidáig hatékony faktorizáló algoritmust találni, azt gyanítjuk, hogy ilyen algoritmus nincs, vagyis a faktorizálási probléma nehéz. Erre a sejtésre azonban még nem született bizonyítás. Önmagában ennek a sejtésnek a bizonyításából nem következne, hogy az RSA-rendszer biztonságos. Tudjuk, hogy az RSA feltörése legfeljebb olyan nehéz, mint a faktorizálási probléma, azt az is, hogy az RSA könnyen azonban nem tudjuk, hogy ugyanolyan nehéz-e. Elképzelheto n faktorizálása nélkül is. feltörheto Az RSA-rendszer elleni lehetséges támadások listája helyett, amely különben is hiányos lenne, utalunk a további hivatkozásokat tartalmazó idevágó irodalomra, valamint a ellenintézke3-4. feladatra. Mindegyik eddig ismert RSA elleni támadásra van megfelelo dés, amelyek meghiúsítják, vagy hatástalanítják a támadást, tehát a támadás sikerességének Foként a valószínusége elhanyagolhatóan kicsivé teheto. a p és q prímszámokat, az n mo és a d titkos kulcsot kell megfelelo gondossággal megválasztani. dulust, az e kitevot Mivel az RSA elleni faktorizálási támadás különösen központi szerepet játszik, bemutatunk egy egyszeru ilyen támadást, amely John Pollard ( p (p
− 1)-módszer
− 1)-módszerén alapszik. A − 1 prímfakto-
p prímfaktorú összetett n szám esetén akkor muködik, ha p
rai kicsik. Ekkor ugyanis meg lehet határozni p
− 1 egyik ν többszörösét anélkül, hogy
p-t
ismernénk, és alkalmazhatjuk a kis Fermat-tételt (lásd a 3.5. következményt), amely szerint a
ν
≡
1 mod p minden a egész szám esetén fennáll, amely p-hez relatív prím. Következés-
ν
képpen p egy osztója a
− 1-nek. Ha n nem osztója aν − 1-nek, akkor lnko(aν − 1, n) valódi
osztója n-nek, s így n-et faktorizáltuk. Hogyan lehet meghatározni p − 1 egy
ν többszörösét? Pollard ( p − 1)-eljárása ν számára
azt a számot alkalmazza jelöltként, amely egy választott S korlát alatti összes prímszámhat-
115
3.3. RSA és faktorizálás
Lépés
Aliz
1
Erik
Bob
véletlenszeruen választ két nagy számot, x-et és y-t, x-et titokban tartja, és kiszámolja az xσy érté-
két
2
(y, xσy)
⇒
3
véletlenszeruen
4 5
kiszámolja a kA
= xσ(yσz)
választ
egy
z
nagy számot, z-t titokban tartja, és kiszámolja az yσz értéket
⇐ yσz érté-
kiszámolja a k B
ket
=
(xσy)σz érté-
ket
3.11. ábra. A kulcscserére vonatkozó,
ványok szorzataként áll elo:
σ-n alapuló RivestSherman-protokoll.
Y
ν=
q q prím, q
k
≤S S
Ha p
algoritmus kiszámítja lnko(a értékkel.
egyszeru Más faktorizálási módszer többek között a négyzetes szita. Ez a következo ötleten alapul. Az n szám faktorizálásához egy bizonyos szitával olyan a és b számokat keresünk, amelyekre: 2
a
≡ b2 2
Következésképpen n osztja az a
mod n
és
a
. ±b mod n .
(3.10)
− b2 = (a − b)(a + b) számot, de nem osztja sem a − b-t, sem
a + b-t. Így lnko(a − b, n) egy nem triviális tényezoje n-nek. A négyzetes szita mellett vannak abban a módszerben különböznek, ahogyan a (3.10)-et más szitamódszerek is, amelyek ettol a és b számokat meghatározzák. Egy példa erre az kielégíto
általános számtest-szita.
Gyakorlatok
3.3-1.? Bizonyítsuk be a 3.13. tételt. Útmutatás. A kis Fermat-tétel 3.5. következményére e d
támaszkodva mutassuk meg, hogy (m ) prímszámok, p
,
q és n
=
≡
e d
m mod p és (m )
≡
m mod q. Mivel p és q e d
következik az (m ) pq, a kínai maradéktételbol
≡
m
mod n
állítás. 3.3-2.? A 3.15. tétel bizonyításának vázlatában felhasználtuk azt, hogy egy n prímszám esetén 1-nek csak két négyzetgyöke van modulo n, nevezetesen a
±1 mod n. Bizonyítsuk be
ezt. Útmutatás. Használjuk fel azt, hogy r pontosan akkor négyzetgyöke 1-nek modulo n, ha n az (r
− 1)(r + 1) számot osztja.
3.3-3. a. Mutassuk meg, hogy a 3.7. példában szereplo
ϕ(n) = 660 és e = 7 értékekre a = 283 titkos kulcs adódik, amely
kiterjesztett euklideszi algoritmus segítségével valóban a d 7 mod 660 inverze.
b. Kódoljuk a 3.7. példában a 3.9. ábrabeli nyílt szöveget a
Σ = {A, B, . . . , Z}
ábécé
betuivel mind a 17 blokk esetén. c. Fejtsük vissza a 3.9. ábrán látható rejtett szövegnek mind a 17 blokkját, és mutassuk meg, hogy az eredeti nyílt szöveget kapjuk vissza. 3.3-4.
digitális aláírásra vonatkozó RSA Mutassuk meg, hogy a 3.10. ábrában szereplo
protokoll muködik.
116
3. Kriptográa
3.4. Rivest, Rabi és Sherman protokolljai Rivest, Rabi és Sherman javasoltak kulcscserére és digitális aláírásra protokollokat. A 3.11. és Sherman tól ered. Könnyen módosítható úgy, hogy ábra kulcscsere protokollja Rivest-tol digitális aláírásra alkalmas legyen (lásd 3.4-1. gyakorlatot). Rivest és Sherman protokollja egy totális, erosen neminvertálható, asszociatív egyirá értjük. Egy totális (tehát mindenhol deniált) nyú függvényen alapszik. Ezen a következot N-be képez, pontosan akkor σ függvény, amelyik N × N-bol xσ(yσz) minden x, y, z ∈ N esetén teljesül, ahol a σ(x, y)
asszociatív, ha (xσy)σz
=
jelölés helyett az xσy je-
a tulajdonságból következik, hogy a protokoll muködik, lölést alkalmaztuk. Ebbol mert kA
= xσ(yσz) =
(xσy)σz
=
k B miatt Aliz és Bob valójában ugyanazt a kulcsot számít-
ják ki. neminvertálhatóságot itt nem kívánjuk formálisan deniálni. Tájékoztatásul Az eros annyit mondunk, hogy
σ-t erosen neminvertálhatónak nevezzük, ha σ nem csupán egyirá-
nyú függvény, hanem akkor sem invertálható hatékonyan, ha a függvényérték mellett ehhez a függvényértékhez tartozó két argumentum egyikét is ismerjük. Ez a tulajdonság megakadályozza azt, hogy Erik y és xσy, illetve yσz ismeretében a titkos x, illetve z számokat ki tudja számolni, amelynek a segítségével a kA
= kB kulcsot könnyen meg tudná határozni.
Gyakorlatok 3.4-1. Módosítsuk Rivest és Sherman 3.11. ábrán látható, kulcscserére vonatkozó protokollját úgy, hogy digitális aláírásra alkalmas protokollt kapjunk. RivestSherman-protokoll 3.4-2. Melyik közvetlen támadás lenne a 3.11. ábrán szereplo ellen hatásos, és hogyan akadályozhatnánk meg? Útmutatás. Érveljünk a irányú függvény
σ asszociatív egy-
neminvertálhatóságának fogalmával, amelyen a protokoll alapszik. eros
neminvertálhatóság fogalmára. eros Nasszociativitás fogalmára parciális, N × N-bol függvények számára. Egy ilyen deníciónak nem kell mindenhol érvényesnek be képezo 3.4-3. a. Adjunk formális deníciót az b. Adjunk formális deníciót az
Egy (esetleg parciális) σ : N × N → N függvényt asszociatívnak nevezzük, ha xσ(yσz) = (xσy)σz minden olyan x, y, z ∈ N esetén érvényben van, amikor az (x, y), (y, z), (x, yσz) és (xσy, z) párok mindnyájan σ deníció kísérletnél: lennie. Mi okoz gondot a következo
értelmezési tartományában vannak. denícióját találjuk Hemaspaandra munÚtmutatás. Ezeknek a fogalmaknak kielégíto kájában.
3.5. Interaktív bizonyítási rendszerek és zéró ismeret 3.5.1. Interaktív bizonyítási rendszerek, ArtúrMerlin-játékok és zéróismeret¶ protokollok Az a probléma, amelyet a DiffieHellman-protokoll elleni
középen állás támadásnál a 3.2. alfejezetben említettünk, nyilvánvalóan abból adódik, hogy Bob a protokoll lejátszása nem gyoz odött partnere valódi kilétérol. Bob azt hiszi, hogy Alizzal elott meg beszélgeto hajtja végre a protokollt, a valóságban azonban Erikkel. Másképpen megfogalmazva Aliz-
3.5. Interaktív bizonyítási rendszerek és zéró ismeret
117
nak az a feladata, hogy Bobot kétséget kizáróan meggyozze személyazonosságáról. A kriptográának ezt a feladatát személyazonosításnak nevezzük. A digitális aláírással szemben, amely az elektronikus úton közvetített dokumentum, mint például az e-mail valódiságát hi van szó, akik a protokollban a részttelesíti, most azoknak a személyeknek a hitelesítésérol felek. Ennek a fogalomnak további értelmezése is van: vevo
személy, vagy résztvevo személy lehet, hanem például egy számítógép, amelyik egy másik számínem csak egy élo tógéppel automatikusan lefolytat egy protokollt. Önmaga hitelességének bizonyítására Aliz felhasználhatna egy csupán általa ismert titkos adatot, mondjuk a PIN kódját (Personal Identifaction Number), vagy más információt,
Aliz kénytelen titkát Bobnak amit rajta kívül más nem ismer. Itt azonban van egy bökkeno. elárulni személyazonossága valódiságának bizonyítására. Ekkor azonban az nem lesz többé már titok. Bob egy harmadik féllel lefolytatott protokoll során közölhetné mondjuk Kris Aliz, mert már ismeri Aliz titkát. Az a kérdés tehát, hogyan bizonyíthatná az tóffal, hogy o van szó a ember egy titok ismeretét anélkül, hogy magát a titkot elárulná. Pontosan errol zéró-ismeretu protokollokban. Ezek speciális interaktív bizonyítási rendszerek, amelyeket Goldwasser, Micali és Rackoff vezettek be. Tolük függetlenül fejlesztette ki Babai és Moran az ezzel lényegében ekvivalens ArtúrMerlin-játékok tervét, amelyet most informálisan leírunk. A hatalmas Merlin varázsló, akit egy M NP gép reprezentál, és a bizalmatlan Artúr király, akit egy A randomizált polinomideju gép reprezentál, közösen meg akarnak oldani egy L problémát, tehát el akarják dönteni, hogy egy x bemenet L-hez tartozik-e, vagy sem. adatért játszanak, miközben felváltva lépnek. Merlin szándéka mindig Mindegyik bemeno szavuk L-hez tartozik, függetlenül az, hogy Artúrt meggyozze arról, hogy a közös x bemeno attól, hogy ez valóban így van-e. Merlin egy lépése az x ∈ L (állítólagos) bizonyítására vonatkozó adat. Ezt megkapja egy M(x, y) szimulációval, ahol x a bemenetet és y az eddigi lépéseket kódolja. Az y szó tehát leírja az M eddigi nemdeterminisztikus választásait, illetve A eddigi véletlen választásait. Artúr király azonban bizalmatlan. A hatalmas varázsló állítólagos bizonyítását termé szetesen nem tudja közvetlenül ellenorizni, ehhez nincs meg a számítási ereje. Kétségbe tudja azonban vonni Merlin bizonyítását, és képes egy ügyes kihívással válaszolni, amely taben a Merlin szolgáltatta bizonyítás véletlenszeruen választott részleteihez ellenorizhet o valószínuséggel núsítványt követel. Hogy Artúrt kielégítse, Merlinnek lenyugöz o meg kell gyoznie Artúr egyik lépése tehát abból áll, hogy A(x, y) ot bizonyításának helyességérol. számításokat szimuláljon, ahol x megint a bemenetet, y pedig a játék eddigi lefutását írják le. váltakozva egzisztenciális és valószínuAz ArtúrMerlin-játék gondolata kifejezheto ségi kvantorokkal, ahol az elobbiek Merlin NP-számítását, az utóbbiak pedig Artúr randomizált polinomiális számításait formalizálják.
4
Ilyen módon bonyolultsági osztályok hie-
rarchiáját deniálhatjuk, az úgynevezett ArtúrMerlin-hierarchiát. Itt az MA osztály deníciójára szorítkozunk, ez egy olyan két lépéses ArtúrMerlin-játéknak felel meg, amelynél Merlin lép eloször. 3.16. deníció (MA az ArtúrMerlin-hierarchiában). Az MA osztály pontosan azokat az L problémákat tartalmazza, amelyekre van egy M NPTM és egy A randomizált polinomideju
4
Ez hasonlít a polinomiálisido-hierarchia lépéseinek
a 4.4. alfejezetet és foként a 4.16. tétel 3. részét).
∃ és ∀ kvantorokkal váltakozva történo jellemzéséhez, (lásd
118
3. Kriptográa
Turing-gép, hogy minden x bemenetre fennáll:
•
Ha x
∈
L, akkor van egy olyan y út M(x)-ben, hogy A(x, y)
elfogad, (vagyis Arthur Merlinnek az megcáfolni, és Merlin nyer).
•
Ha x
<
x
∈
L, akkor M(x) mindegyik y útját A(x, y)
Artúrt Merlin
x
∈
≥
3/4 valószínuséggel
L-re vonatkozó y bizonyítását nem tudja
≥ 3/4 valószínuséggel elutasítja (vagyis
L-re vonatkozó hamis bizonyítása nem téveszti meg, és nyer).
Ennek megfeleloen lehet deniálni az AM, MAM, AMA, . . . osztályokat (lásd a 3.5-1. gyakorlatot). A 3/4 valószínuségi küszöb a 3.16. denícióban, amely szerint Artúr elfogad vagy elutasít, önkényesen lett megválasztva, és eleinte nem tunik elég nagynak. Valójában lehet nö velni a siker valószínuségét, és 1-hez tetszolegesen közel hozni. Másként megfogalmazva, a denícióban alkalmazhatunk 1/2
+ ε valószínuséget egy tetszoleges rögzített ε > 0 kons-
tanssal, s így még mindig ugyanazt az osztályt kapjuk. Továbbá ismert az, hogy a lépések egy konstans száma esetén ez a hierarchia beleolvad az AM osztályba ( stabilizálódik): NP ⊆ MA ⊆ AM = AMA = MAM = · · · . Az a kérdés azonban még nyitott, hogy az NP
⊆ MA ⊆ AM tartalmazás valódi-e. A fent említett interaktív bizonyítási rendszerek az ArtúrMerlin-játékok változatai.
Jelentéktelen különbség a terminológiában az, hogy Merlin az
igazoló, Artúr pedig az o, ellenorz és a kommunikáció nem játékként zajlik, hanem protokoll formájában. Elso különbség, hogy Artúr véletlen bitje nyilvánosan pillantásra a két modell között az a jelentos o véletlen bitje az és elsosorban Merlin számára ismert, ezzel ellentétben az ellenorz interaktív bizonyítási rendszerekben titkos. Goldwasser és Sipser megmutatták azonban, hogy valójában lényegtelen az, hogy a véletlen bit titkos, vagy nyilvános. Tehát az Artúr Merlin-játékok és az interaktív bizonyítási rendszerek egymással ekvivalensek. Ha a játékban konstans számú lépés helyett polinomiálisan sokat engedünk meg és többet a polinomiális idokorlátozás miatt nem lehet , akkor az IP osztályt kapjuk. Dení ció szerint IP tartalmazza az egész NP-t, és foként a grázomorzmus-problémát. Késobb látni fogjuk, hogy IP tartalmaz coNP
= {L | L ∈
felNP}-beli problémákat is, amelyekrol
tesszük, hogy nincsenek NP-ben. A 4.21. tétel bizonyítása elsosorban azt mutatja meg, hogy a grázomorzmus-probléma komplementere AM-ben és így IP-ben van. Shamir egyik híres eredménye azt mondja, hogy IP még PSPACE-szel is megegyezik, azon problémák osz tályával, amelyek a polinomiális térben eldönthetok. Térjünk azonban vissza a hitelesség elobb vázolt problémájához, és a zéró-ismeretu protokollok fogalmához. Nézzük az alapgondolatot. Tegyük fel, hogy Artúr és Merlin egyik játékukat játsszák. Az interaktív bizonyítási rendszerek terminológiája szerint ebben az IPprotokollban Merlin nehéz bizonyítást küld Artúrnak. Hogy honnan varázsolta ezt a bizo ismeri, ezzel hitelesíteni tudja magát Artúr elott. nyítást, az Merlin titka, és mivel csak o Amit egyikük sem tud: a gonosz varázsló Marvin varázsital segítségével Merlin ha sonmásává változott, és Artúr elott Merlinként akarja kiadni magát. Merlin titkát azonban nem ismeri. Hasonlóképpen nincs meg neki Merlin hatalmas varázslóereje sem, mágiája nem nagyobb, mint egy közönséges randomizált polinomideju Turing-gép számítási ereje. Ugyanolyan csekély, mint amennyire Artúr képes Marvinnak Merlin-bizonyítást találni. Ennek ellenére megkísérli, hogy a Merlin és Artúr közötti kommunikációt szimulálja. Egy IP-protokoll pontosan akkor zéró-ismeretu, ha az az információ, amely Marvin és Artúr között kicserélésre kerül, nem különbözik a Merlin és Artúr közötti kommuniká-
119
3.5. Interaktív bizonyítási rendszerek és zéró ismeret
ciótól. Ekkor Marvin, aki Merlin titkos bizonyítását nem ismeri, természetesen nem tud róla a szimuláló protokollba semmiféle információt sem áramoltatni. Bár abban a helyzetben van, hogy az eredeti protokollt pontosan lemásolta, úgy, hogy egy független meggyelo semmiféle különbséget nem tudna felfedezni, a protokoll semmilyen információt nem tud közölni: Ahol nincs, ott ne keress! 3.17. deníció (zéró-ismeretu protokoll). L
∈
IP esetén legyen M NPTM és A pedig ran-
domizált polinomideju Turing-gép úgy, hogy (M, A) interaktív bizonyítási rendszer L számára. Az (M, A) IP-protokoll pontosan akkor zéró-ismeretu protokoll L számára, ha van
b randomizált polinomideju Turing-gép, hogy ( M b, A) az (M, A) eredeti protokollt egy olyan M szimulálja, és minden x
∈
b, A)-beli kommunikációt L esetén az (M, A)-beli, illetve az ( M
b1 , m b2 , . . . , m bk ) sorozatoknál azonos a pénzfeldobás elreprezentáló (m1 , m2 , . . . , mk ) és (m oszlása. A fent deniált fogalmat az irodalomban úgy nevezik, hogy tökéletes zéró ismeret becsületes igazolóval (honest-verier perfect zero-knowledge). Ez a következoket jelenti: o Artúr becsületes (aminek nem feltétlenül kell teljesülnie (a) feltesszük, hogy az ellenorz a kriptográai alkalmazásokban), és (b) megkívánjuk, hogy a szimuláló protokollban közölt információ tökéletesen megegyezzék az eredeti protokollban közölt információval. Az feltétel némileg idealista, a második alkalmasint túl szigorú. Ezért vizsgálják a zéróelso megjegyzéseket). ismeretu protokollok más változatait (lásd a fejezet végén levo
3.5.2. Zéró-ismeret¶ protokoll gráfizomorfizmusra GI NP-ben van, a komplementer GI, AM-ben (lásd a 4.21. tétel bizonyítását). Így mindkét probléma IP-ben van. Most adunk egy zéró-ismeretu protokollt GI-re. Bár manapság nincs hatékony eljárás GI-re, Merlin meg tudja oldani ezt a problémát, mert GI NP-ben van. Jóllehet nem szükséges, hogy ezt tegye. Megteheti, hogy egyszeruen választ egy nagy G 0 gráfot, amelynek n csúcsa van, valamint véletlenszeruen egy π ∈ Sn permutációt, és eloállítja a G 1 = π(G 0 ) gráfot. A (G 0 , G 1 ) párt nyilvánosságra hozza, a G 0 és G 1 közötti π izomorzmust saját információjaként titokban tartja. A 3.12. ábra mutatja a Most egy konkrét példát vizsgálunk. Már említettük, hogy probléma pedig
Merlin és Artúr közötti IP-protokollt. Természetesen Merlin nem küldheti el Artúrnak egyszeruen
π-t, mert akkor elárulná a
titkát. Annak bizonyítására, hogy az adott G 0 és G 1 gráfok valóban izomorfak, Merlin vá ρ izomorzmust és egy a bitet, és eloállítja egy kihívással válaszol: küld Merlinnek = ρ(Ga ) gráfot. Ezután elküldi Artúrnak H-t. O egy véletlenszeruen egyenletes eloszlással választott b bitet, és követel tole egy σ izomorzmust G b és H között. Ezt pontosan akkor fogadja el Artúr, ha Merlin σ-jára valóban teljesül σ(Gb ) = H. A protokoll muködik, mert Merlin ismeri saját titkos π izomorzmusát és véletlenszeruen választott ρ permutációját. Nem okoz problémát Merlinnek, hogy kiszámolja a σ hitelesítse magát. A π titkot azonban nem árulja izomorzmust G b és H között és Artúr elott laszt véletlenszeruen egyenletes eloszlással egy aH
el. Mivel G 0 és G 1 izomorfak, Artúr 1 valószínuséggel elfogad. Itt egyáltalán nem kell vizs gálni két nem izomorf gráf esetét, mivel Merlin a protokollnak megfeleloen izomorf G 0 és G 1 gráfokat választ (lásd a 4.21. tétel bizonyítását is). Merlinként kiadni. Ismeri a G 0 és Tegyük fel, hogy Marvin szeretné magát Artúr elott
120
3. Kriptográa
Lépés 1
2
Merlin
Artúr
ρ véletlen permutációt V (G0 )∈ {0, 1} bitet, kiszámolja H =
választ egy ra és egy a
ρ(Ga )-t
H
⇒ választ egy b ∈ {0, 1} véletlen bitet, majd G b és H között követel egy izo-
3
4 5
kiszámolja a
σ
izomorzmust
σ(Gb ) =
⇐b
morzmust
H-
val:
= a, akkor σ = ρ; = b , a = 1, akkor σ = πρ; −1 ha 1 = b , a = 0, akkor σ = π ρ. ha b ha 0
σ⇒
6
ellenorzi, hogy
7
σ(Gb ) =
H, és akkor
fogadja el, ha ez teljesül 3.12. ábra. Goldreich, Micali és Wigderson
Lépés 1
Marvin
Artúr
ρ véletlen permutációt V (G0 )a ∈ {0, 1} bitet, kiszámolja H =
választ egy ra, és egy
2
GI-re vonatkozó zéró-ismeretu protokollja.
ρ(Ga )-t
H
⇒
3
választ egy b
∈ {0, 1}
véletlen bitet,
és követel egy izomorzmust G b és
⇐b
4 5
ha b
,
H között
b kitöröl minden ebben a a, akkor M
körben eddig közvetített információt és ismétel; ha b
b elküldi σ = ρ-t = a, akkor M
σ⇒
6 7
b
=
a esetén
σ(Gb ) =
H, ezért Ar-
túr elfogadja Marvin hamis személyazonosságát 3.13. ábra. A
GI-re vonatkozó zéró-ismeretu protokoll szimulációja π ismerete nélkül.
π izomorzmust. Mégis szeretné színlelni, hogy ismeri π-t. Ha az Artúr által választott b bit véletlenül megegyezik az a bittel, amelyet Marvin elore −1 nyer. Ha azonban b , a, akkor a σ = πρ vagy σ = π ρ kiszámítása határozott meg, akkor o igényli π ismeretét. Mivel GI egy randomizált polinomideju Turing-gép számára túl nehéz,
G 1 gráfokat, de nem ismeri a titkos
és hatékonyan nem számítható ki, Marvin elég nagy G 0 és G 1 gráfok esetén nem tudja
π-t, csak találgathat. Az o esélye arra, = a, legfeljebb 1/2. Természetesen Marvin sikervalószínusége mindig találgathat, és így az o pontosan 1/2. Ha Artúr azt kívánja, hogy
meghatározni a
π
izomorzmust. Nem ismerve a
hogy véletlenül elcsípjen egy b bitet, amelyre b
r független körben végezzék el a protokollt, akkor a csalás valószínusége a 2 szorítható le. Ez már r
=
−r
értékre
20 esetén is elenyészoen csekély: Marvin sikervalószínusége
kisebb, mint egy a millióhoz. protokoll valóban zéró-ismeretu Meg kell még mutatnunk, hogy a 3.12. ábrán szereplo protokoll. A 3.13. ábrán látható egy szimuláló protokoll Marvinnal, aki Merlin
π titkát nem
ismeri, de azt színleli, hogy ismeri. Az az információ, amelyik a protokoll egy lefutása alatt kicserélésre kerül, a (H, b, σ) hármasként adható meg. Ha Marvin véletlenszeruen választ egy a bitet, és a
=
b, akkor egyszeruen elküldi
σ = ρ-t
és nyer: Artúr, vagy bárki más
nem tud semmilyen szabálytalanságot felfedezni. Másrészt, ha a független meggyelo
, b,
121
3. Feladatok
Marvin csalása leleplezodik. Ez azonban nem okoz gondot az álnok varázslónak: egyszeruen kitörli a szimuláló protokollból ezt a kört és újra próbálkozik. Így (H, b, σ) formájú hármasok sorozatát tudja eloállítani, amelyek a Merlin és Artúr közötti eredeti protokoll sorozataitól megkülönböztethetetlenek. Így Goldreich, Micali hármasaiból álló megfelelo és Wigderson
GI protokollja zéró-ismeretu protokoll.
Gyakorlatok
3.5-1. Deniáljuk az ArtúrMerlin-hierarchia AM, MAM, AMA, . . . osztályait a 3.16. deníció MA osztályához hasonlóan. 3.5-2. Melyik osztályt kapjuk egy olyan ArtúrMerlin-játékban, amelyik csak egy lépésbol áll, amelyet Merlin, illetve amelyet Artúr végez? 3.5-3. Folytassuk le a 3.12. ábrán látható zéró-ismeretu protokollt a G 0 gráfok, valamint a G és H közötti
π=
(13
=
G és a G 1
=
H
) izomorzmus esetén, ahol G és H a 3.1.3. 2
2 3 4 5 4 1 5
pontban a 3.4. példabeli gráfok. Játsszuk le ezt az ArtúrMerlin-játékot egy magunk választotta
ρ izomorzmussal a ∈ {0, 1} és b ∈ {0, 1} mindegyik változatára. Ismételjük meg ezt a ρ izomorzmussal, amelyet valaki más választott.
játékot egy számunkra ismeretlen
−10
3.5-4. Módosítsuk a 3.12. ábra protokollját úgy, hogy Marvin csalásvalószínusége a 2
érték alá kerüljön. Adjuk meg ennek a valószínuségnek egy formálisan helyes elemzését.
Feladatok Z k maradékosztálygyur uben ∈ N és x, y, z ∈ Z. Azt mondjuk, hogy x kongruens y-nal modulo k (röviden: x ≡ y mod k), ha k osztja az y − x különbséget. Az x + kZ = {y ∈ Z | y ≡ x mod k} halmazt x mod k vett maradékosztályának nevezzük. Például 3 mod 7 maradékosztálya a 3 + 7Z = {3, 3 ± 7, 3 ± 2 · 7, . . .} = {3, 10, −4, 17, −11, . . .}
3-1. Aritmetika a Legyenek k
halmaz. Egy x mod k maradékosztály reprezentánsa legyen mindig a legkisebb természetes szám x
+ kZ-ben;
például 3 reprezentálja a 3 mod 7 maradékosztályt. Az összes mod k
Zk = {0, 1, . . . , k − 1}. Zk -n deniálunk összeadást az + kZ) + (y + kZ) = (x + y) + kZ és szorzást az (x + kZ) · (y + kZ) = (x · y) + kZ szabályok segítségével. A modulo 7 vett aritmetikában például (3 + 7Z) + (6 + 7Z) = (3 + 6) + 7Z = 2 + 7Z és (3 + 7Z) · (4 + 7Z) = (3 · 4) + 7Z = 5 + 7Z. vett maradékosztály reprezentánsa (x
Bizonyítsuk be, hogy modulo k aritmetikát alkalmazva: a.
(Zk , +, ·) kommutatív egységelemes gyur u;
b.
A 3.3. példában deniált
c.
(Z p , +, ·) minden p prímszám esetén test. Milyen struktúra (Z p
Z∗k
halmaz multiplikatív csoport;
∗
∪ {0}, +, ·),
ha p prím-
szám? d.
Bizonyítsuk be, hogy egy csoport semleges eleme, valamint minden csoportelem inverze egyértelmuen meghatározott.
e.
R gyur u invertálható elemei csoR úgynevezett egységcsoportját. Mi a Zk gyur u egységcsoportja? a Zk maradékosztálygyur u nullosztóit. Mutassuk meg, hogy Zk -ban
Mutassuk meg, hogy egy kommutatív egységelemes portot alkotnak, az
f.
Határozzuk meg
nincs nullosztó, ha k prímszám.
122
3. Kriptográa
3-2. Faizomorzmus Speciális gráfosztályok esetén, például a fák osztályában, a
GI probléma hatékonyan meg-
körmentes gráf, ahol egy kör egymásután követoldható. Egy (irányítatlan) fa összefüggo, élekbol áll, úgy, hogy a kiindulási csúcsba visszatérünk, és minden csúcs legfeljebb kezo egyszer szerepel benne. Egy fa levelei az 1-fokú csúcsok. Tervezzünk hatékony algoritmust a faizomorzmusra, amely P-ben van. Ezt a problémát így deniáljuk:
TI
=
{(G, H) | G és H izomorf fák} .
számsorozatokkal, és Útmutatás. Jelöljük meg fokozatosan az adott fák csúcsait megfelelo sorozatokat. Kezdjük a levelekkel és mindegyik lépésben hasonlítsuk össze a kapott jelölo lépésre haladjunk a fa belseje felé, amíg az összes csúcsot meg nem jelöltük. lépésrol 3-3. Determináns számítása Írjuk meg egy olyan algoritmus pszeudokódját, amelyik egy mátrix determinánsát haté konyan kiszámítja. Ültessük át az algoritmust egy tetszoleges programnyelvre. Ki lehet-e hatékonyan számítani egy mátrix inverzét? 3-4. Alacsony kitevoj u támadás
a.
A 3.8. ábrán látható RSA-rendszerben az e
=
hatékonysági okok miatt nép3 kitevo
szeruségnek örvend. Ez azonban veszélyes lehet. Tegyük fel, hogy Aliz, Bob és Kristóf ugyanazt az m üzenetet ugyanazzal a nyilvános e
=
3 kitevovel, de esetleg különbözo
rejtett szöveget: nA , n B és nC modulusokkal rejtjelezik. Erik elcsípi a három keletkezo ci
=
3
m
mod ni , ahol i
∈ {A, B, C }.
Ezután Erik az m üzenetet könnyen vissza tudja
fejteni. Hogyan? számára Útmutatás. Erik ismeri a kínai maradéktételt. Egy javasolt érték a kitevo = 216 + 1, amelynek bináris eloállításában csak két ´ algoritmus nagyon gyorsan feldolgozza. ´ e
b.
egyes van, s így a M ´
A fent leírt támadásokat ki lehet terjeszteni k darab olyan rejtett szövegre, amelyek egymással kapcsolatban vannak. Legyenek ismertek valamilyen ai és bi 1 értékek, és tegyük fel, hogy k darab ci mindegyiket el is fogták, ahol k
>
e(e
= (ai m + + 1)/2 és
≤
i
≤
k
e
bi ) mod ni üzenetet küldtek el és min(ni )
>
2
e
2 . Hogyan tudja egy
támadó kideríteni, hogy mi az eredeti m üzenet? Útmutatás. Az úgynevezett rácsredukciós technikával (lásd például Miccianció és Goldwasser cikkét). c.
Hogyan lehet ezt a támadást elhárítani?
Megjegyzések a fejezethez Diffie és Hellman nyilvános kulcsú kriptográáról szóló munkája [111]. Az angol, francia, német és nn nyelvu szövegek betuinek gyakoriságáról [407]-ban olvashatunk. Charles
123
3. Megjegyzések a fejezethez
Babbageról Singh ír a könyvében [433]. Claude Shannon korszakalkotó munkája a tökéletes [426]. Ron Rivest, Adi Shamir és Leonard Adleman [391] titkosságú kriptorendszerekrol ismert nyilvános kulcsú kriptorendszert. Agrawal, Kayal és munkájukban írták le az elso Saxena[4] munkájukban publikálták azt az eredményt, hogy a
PRIMES = {bin(n) | n prím}
prímszámprobléma a P bonyolultsági osztályba tartozik. [375]-ben olvashatunk. Rabin és Miller véletlen prímJohn Pollard ( p − 1)-módszerérol tesztje a [330, 381] cikkekben, Solovay és Strassen prímtesztje pedig a [436] cikkben található meg. Választott szövegu támadásról olvashatunk a [398] dolgozatban. Az RSArendszer elleni lehetséges támadásokról a további utalásokat tartalmazó [55]-ben lehet olvasni. A négyzetes szita leírását megtalálhatjuk például [439]-ben, az szita leírását pedig az [288] cikkben.
általános számtest
Stinsonnál [439] olvashatunk arról, hogy ha p és q prímszámok, p e d
hogyan következik az (m ) kínai maradéktételbol
≡
m
,
q és n
=
pq, a
mod n állítás. A 3.4-3. gyakorlat
deníciót találunk a [201, 202] munkákban. A zéró-ismeretu megoldásához kielégíto protokollokat Goldwasser, Micali és Rackoff [162] vezették be. Az ArtúrMerlin-játékok tervét Babai és Moran [23, 24] fejlesztették ki. Goldwasser és Sipser [163] munkájában olvashatunk arról, hogy az interaktív bizonyítási rendszerek esetén lényegtelen az, hogy a véletlen bit titkos, vagy nyilvános. A [425]cikkben található meg Shamir híres eredménye arról, hogy IP PSPACE-szel megegyezik. A
GI
problémára adott zéró-ismeretu protokoll Goldreich, Micali és Wigderson
munkájáig [160] nyúlik vissza. A faizomorzmusra vonatkozó 3-2. feladathoz lásd [246]-t is. A 3-4. feladatban említett rácsredukciós technikát lásd például [326]-ben. Az itt említett támadás Johan Håstad [186] munkájára nyúlik vissza, és Don Coppersmith [88] javította. Singh [433] könyve szép bepillantást nyújt a kriptológia fejlodésének történetébe, kezdve a modern rejtjelezo eljárásokig. Például ott olvashatjuk, az ókori gyökerektol hogy a brit Állami Kommunikációs Központ (Government Communications Headquarters; GCHQ) egyik különleges egysége, a Kommunikációs-elektronikai Biztonsági Csoport (Communications Electronics Security Group; CESG) azt állítja, hogy Ellis, Cocks és Williamson nevu munkatársai mind a 3.8. ábrán látható RSA-rendszert, mind a 3.7. ábrabeli DiffieHellman-protokollt hamarabb feltalálták, mint Rivest, Shamir és Adleman, illetve hamarabb, mint Diffie és Hellman, érdekes módon fordított sorrendben. Az RSA-rendszer jószerével minden, a kriptográáról szóló könyvben le van írva. Az RSA elleni támadásokról, mint amilyen a 3.3. alfejezetben szerepel, átfogó listát találunk például a [55, 398] cikkekben. áttekinto Prímszámtesztek, mint amilyen a MR-algoritmus, valamint faktorizáló algoritmusok szintén sok könyvben megtalálhatók, például [159, 407, 439] -ben. Az erosen neminvertálható, asszociatív egyirányú függvények fogalma, amelyen az és Sherman3.11. ábrán látható titkos kulcscserére vonatkozó protokoll alapszik, Rivest-tol tól származik. Ennek a protokollnak a módosítása, amely digitális aláírásra alkalmas, Ra akik [380] munkájukban azt is bebizonyították, hogy binak és Sherman-nak köszönheto, kommutatív, asszociatív egyirányú függvény pontosan akkor létezik, ha P
,
NP. Kétségte-
len, hogy az általuk konstruált egyirányú függvények sem nem totálisak, sem erosen nem invertálhatók, még P
,
NP fennállása esetén sem. Hemaspaandra és Rothe [202] megmu-
tatták, hogy totális, erosen nem invertálható, kommutatív, asszociatív egyirányú függvény pontosan akkor adódik, ha P
, NP teljesül (lásd a [46, 201] cikkeket is).
124
3. Kriptográa
Az interaktív bizonyítási rendszerek és zéró-ismeretu protokollok területére vonatkozólag a legjobb és legátfogóbb forrást Goldwasser, Micali és Rackoff mutatták be [162] munkájukban, ez Goldreich könyvében [159] a 4. fejezet. Hasonlóképpen szép kimutatást találhatunk például Köbler és társai [247] és Papadimitriou [358] könyvében, valamint a cikkekben. Az ArtúrMerlin-játékokat foként [158, 161, 398] áttekinto Babai és Moran [23, 24], valamint Zachos és Heller [505] vizsgálták. [159] részletesen foglalkozik a zéró-ismeretu protokollok olyan változataival, amelyek található róluk például a technikai részletekben térnek el a 3.17. deníciótól. Némi ízelíto [158, 161, 398] dolgozatokban. A kriptográával foglalkozik magyar nyelvu könyvében Ködmön József [249], Buttyán Levente és Vajda István [64], valamint Simon Singh [433].
4. Bonyolultságelmélet
A 3. fejezetben kriptográa módszerek és protokollok szempontjából fontos algoritmusokkal ismerkedtünk meg, mint amilyen a square-and-multiply algoritmus. Az algoritmusok akkor boldogok, ha sikerül egy probléma hatékony megoldását eloállítaniuk. fejlesztoi Ennek során viszont sok fontos probléma sajnos megmakacsolja magát, és konok módon ellenáll minden kísérletnek, melynek célja hatékony megoldó algoritmus kifejlesztése lenne. Ilyen problémák például a Boole-kifejezések kielégíthetoség problémája, a párosítás és a grázomorzmus problémái, melyeket a fejezetben részletesen tárgyalunk. A bonyolultságelmélet egyik legfontosabb feladata ilyen és hasonló problémák kiszá akkor elémíthatósági bonyolultság szerinti osztályozása. Miközben az algoritmusfejleszto gedett, ha egy, a problémáját megoldó konkrét algoritmus fejlesztése során konkrét futási mellett meg tud orizni ido egy, a lehetoségekhez mérten legjobb felso bonyolultsági kor legjobb alsó korlát meghatározásán fálátot, a bonyolultságelméleti szakember egy leheto radozik. Az algoritmusok elmélete és a bonyolultságelmélet ilyen szempontból kiegészítik és alsó korlát egybeesik, akkor a problémát osztályoztuk. egymást. Ha a felso Annak bizonyítéka, hogy egy probléma nem oldható meg hatékonyan, gyakran negatív hatású és egyáltalán nem kívánatos. Van azonban a bizonyításnak egy pozitív aspektusa is: a kriptográa tárgykörében (lásd a 3. fejezetet) épp a rossz hatékonyság hiányában vagyunk érdekeltek. Annak bizonyítása, hogy egyes problémák csak rossz hatékonysággal oldhatók meg, mint például a faktorizálás probléma vagy a diszkrét logaritmus, titkosított üzenetek átvitelekor a biztonság növekedését jelentik. A 4.1. alfejezetben lefektetjük a bonyolultságelmélet alapjait, különös tekintettel a P és NP bonyolultsági osztályok denícióira. Nagyon fontos kérdés, hogy ez a két osztály különbözo-e vagy sem. Ez évtizedek óta a bonyolultságelmélet és az egész elméleti informatika központi kérdése. A mai napig sem a P
, NP sejtést, sem pedig P és NP egyenlosé-
ad az NP-teljesség elméletébe, gét nem sikerült bizonyítani. A 4.2. alfejezet rövid bevezetot amely ezzel a kérdéskörrel különösen intenzíven foglalkozik. A leghíresebb NP-teljes problémák egyike a
SAT, az ítéletlogika kielégíthetoség prob-
lémája: kielégítheto-e egy adott Boole-formula igazságértékeket behelyettesítve változóiba,
SAT probléma NP-teljessége miatt naSAT hatékony (és determinisztikus) megoldó algoritmussal rendel kezzen. A 4.3. alfejezetben bemutatunk SAT-hoz egy determinisztikus és egy valószínuségi
vagyis igazzá teheti-e valamely behelyettesítés? A gyon valószínutlen, hogy
algoritmust, melyek mindketten exponenciális idoben muködnek. Futási idejük a gyakor szinten tartható még úgy is, hogy ezek az latban fontos bemenetméretek mellett elviselheto
126
4. Bonyolultságelmélet
algoritmusok aszimptotikusan rossz hatékonyságúak, tehát nagyon nagy bemenetekre csillagászati méretu ráfordítást igényelnek. A 4.4. alfejezetben újra elovesszük a
GI
grázomorzmus problémát, amit a
3.1.3.
alfejezet 3.8. deníciójában ismertettünk, és a zéró ismeretu protokolloknál játszott szerepet. Ez a probléma azon NP-beli természetes problémák egyike, melyek valószínuleg (az P elfogadhatónak tun o
,
NP feltevés mellett) nem oldhatók meg hatékonyan, és nem is
NP-teljesek. Ilyen szempontból
GI
különleges helyzetet élvez az NP-beli problémák hal-
(angolul mazában. Az erre utaló jelek az úgynevezett alsóság-elméletbol
lowness theory) erednek, amit a 4.4. alfejezetben ismertetünk. Többek között megmutatjuk, hogy GI az NP-n belüli alsó-hierarchiában helyezkedik el, ami nagyban valószínusíti, hogy Ezen kívül megmutatjuk, hogy
GI
GI nem NP-teljes.
az SPP bonyolultsági osztályban fekszik, és ezáltal al-
sóbb ( low) az ismert valószínuségi bonyolultságosztályoknál. A formális megfogalmazást kerülve egy halmaz alsóbb egy C bonyolultsági osztálynál, ha mint orákulum, mint jós semmiféle hasznos információt nem szolgáltat a C-számítások számára. A fent nevezett következmény bizonyításához, annak belátásához, hogy
GI
alsóbb bizonyos bonyolultsági
osztályoknál, nagyon hasznosnak mutatkoznak egyes csoportelméleti algoritmusok.
4.1. Alapok A bevezetésben említettük, hogy a bonyolultságelmélet többek között alsó korlátok meghatározásával foglalkozik. Ennek nehézsége abban rejlik, hogy nem elég a vizsgált problémát megoldó egyetlen konkrét algoritmus futási idejét elemezni, hanem meg kell mutatnunk, algoritmus futási ideje legalább akkora, mint hogy a problémát megoldó összes elképzelheto a felmutatott alsó korlát. Ezek közé az algoritmusok közé olyanok is tartozhatnak, melyeket következoen lépésként az algoritmus fogalmát formátalán még ki sem találtak, ebbol elso lis és matematikailag pontos módon kell megragadnunk, máskülönben nem beszélhetünk az algoritmusok összességérol. elképzelheto formális algoritmus-modellre tettek javaslatot. Az 1930-as évek óta már sok különbözo Ezek a modellek ekvivalensek egymással olyan értelemben, miszerint bármelyik modell át alakítható egy tetszolegesen választott másik ilyen modellé. Kissé pongyolán fogalmazva ez a transzformáció felfogható mint egyfajta programnyelvek közti fordítás. Az eddigi ismert modellek ekvivalenciája alapján az úgynevezett Church-tézis felteszi, hogy minden egyes algoritmusmodell pontosan a - természeténél fogva elég bizonytalanul körülhatárolható -
intuitív kiszámítások fogalmát írja le. A bonyolultságelméletben használt szoká sos algoritmusmodell az 1936-ban Alan Turing (19121954) által bevezetett Turing-gép. A Turing-gép a számítógépek egy nagyon egyszeru absztrakt modellje, melyet a követke zokben szintaxisán és szemantikáján keresztül deniálunk. Eközben egyúttal bevezetünk kiszámíthatóságelméleti vezérgondolatot: a determinisztikusságot és a nemkét különbözo determinisztikusságot. Célszeruen eloször az általánosabb nem-determinisztikus Turing aztán speciális esetként közvetlenül adódnak a determinisztikus gépeket írjuk le, amibol Turing-gépek. a Turing-gép néhány technikai részletét és muködését Mindenek elott ismertetjük. Egy Turing-gép rendelkezik k darab mindkét irányban végtelen munkaszalaggal, melyek me zokre vannak felosztva. A mezokben betuk (jelek) állhatnak. Azt a tényt, hogy egy mezo üres, egy speciális jellel, a
-szimbólummal
jelöljük. A tényleges számítás a munkasza-
127
4.1. Alapok
véges állapotú vezérlőegység fej
bemeneti szalag I
fej
munkaszalag P S Z T
N P U T
!
I D E A F E L D O L G O Z Á S J Ö N 4.1. ábra. Turing-gép.
lagokon történik. Egy számítás kezdetekor a bemeneti szó egy meghatározott szalagon, a bemeneti szalagon található, aminek minden bemeneti szóhoz nem használt további me zoje a
jelet tartalmazza. A számítás befejeztével az eredmény egy másik meghatározott
szalagon, a kimeneti szalagon jelenik meg. Minden szalaghoz egy-egy író-olvasó fej férhet hozzá, amely a gép minden lépésében felülírhatja az aktuálisan olvasott betut, ezután el jobbra vagy balra, illetve állva maradhat az aktuális mezon. mozdulhat egy mezot Eközben memóriájában (véges állapotú vezéra gép aktuális állapota megváltozhat, melyet a belso loegység, angolul látható.
1
nite control) feljegyez.
A
4.1. ábrán egy két szalagos Turing-gép
4.1. deníció (a Turing-gép szintaxisa). Egy k szalagos nemdeterminisztikus Turing-gép
= (Σ, Γ, Z, δ, z0 , , F) hetes, ahol Σ a bemeneti ábécé, Γ a munka ábécé (szalagjelek) melyre Σ ⊆ Γ, Z véges állapothalmaz, ahol Z ∩ Γ = ∅, δ : Z × Γk → P(Z × Γk × {L, R, N }k ) az átmenetfüggvény, z0 ∈ Z a kezdoállapot, ∈Γ−Σ az üres jel és F ⊆ Z a végállapotok halmaza. P(S ) egy S halmaz hatványhalmazát jelöli,
(röviden k-szalagos NTM) egy M
tehát S összes részhalmazának halmazát.
0 ∈ Z, x ∈ {L, R, N } és a, b ∈ Γ mellett (z0 , b, x) ∈ δ(z, a) helyett a rövidített 0 (z , b, x) jelölést is használhatjuk. Ha az aktuális állapot z, a fej pedig egy a feliratú
Minden z, z (z, a)
7→
mezon áll, akkor a fenti Turing-gép parancs a következo lépések végrehajtását jelenti:
• • •
a felülírását b-vel,
0
egy új z állapot felvételét és az x
∈ {L, R, N }-nak
megfelelo fejmozgást, azaz egy mezonyi lépést balra (L, az angol
left után), vagy egy lépést jobbra (R, azaz
(N mint aktuális mezon
neutral, semleges).
right), vagy a fej helyben marad az
A k szalagos determinisztikus Turing-gép (röviden a k-szalagos DTM) speciális esetéhez akkor jutunk, ha a A k
=
δ átmenetfüggvény Z × Γk -ról Z × Γk × {L, R, N }k -ra képez.
1 esetben az 1-szalagos Turing-gépekhez jutunk, melyeket NTM-ként, illetve
DTM-ként rövidítünk. Minden k-szalagos NTM illetve k-szalagos DTM szimulálható meg egy szalagos Turing-géppel, amelynél a számítási ido legfeljebb négyzete az eredetifelelo
1
Lehetséges további megkötések bevezetése is, például lehet a bemeneti szalag csak olvasható, illetve a kimeneti
szalag csak írható. Hasonlóképp a technikai részletek kidolgozásakor számos további megoldás lehetséges, megkövetelhetjük, hogy meghatározott fejek csak meghatározott irányba mozdulhassanak el, vagy a szalagok csak egyik irányba legyenek végtelenek és így tovább.
128
4. Bonyolultságelmélet
nek. Ésszeru lehet több szalag használata, amennyiben a hatékonyság szerepét nem hanyagolhatjuk el. A Turing-gépek felfoghatók mint olyan elfogadó automaták, melyek nyelveket (szóhalmazokat) fogadnak el. Emellett a Turing-gépek használhatók függvények kiszámításához is.
= (Σ, Γ, Z, δ, z0 , , F) egy NTM. M ∈ Γ∗ Z Γ∗ szó. Ha k = αzβ, akkor αβ jelentése az aktuális szalagfelirat (az aktuális szó a fej által már meglátogatott szalagrészrol), a fej β elso szimbólumán 4.2. deníció (a Turing-gép szemantikája). Legyen M
egy kongurációja egy k
áll, z pedig az M aktuális állapota.
K M = Γ∗ Z Γ∗ halmazára deniálunk egy ` M bináris relációt, amely 0 a k ∈ K M kongurációból k ∈ K M kongurációba vezeto átmenetet írja le a δ átme∗ netfüggvény segítségével. Legyen minden α és β Γ -beli szóra, ahol α = a1 a2 · · · am és β = b1 b2 · · · bn , m ≥ 0, n ≥ 1 és minden z ∈ Z-re: 0 0 a a · · · am z cb2 · · · bn , ha (z, b1 ) 7→ (z , c, N), m ≥ 0 és n ≥ 1 , 1 2 0 0 a1 a2 · · · am cz b2 · · · bn , ha (z, b1 ) 7→ (z , c, R), m ≥ 0 és n ≥ 2, αzβ ` M a a · · · a z0 a cb · · · b , ha (z, b ) 7→ (z0 , c, L), m ≥ 1 és n ≥ 1. M kongurációinak
1
m−1
2
m
2
n
1
Megvizsgálandó még két speciális eset: 1.
7→ (z0 , c, R) (tehát M 0 akkor a1 a2 · · · am zb1 ` M a1 a2 · · · am cz .
2.
Ha m
Ha n
=
1 és (z, b1 )
=
7→ (z0 , c, L) (tehát ` M z0 cb2 · · · bn .
0 és (z, b1 )
akkor zb1 b2
· · · bn
jobbra mozdul és egy
-szimbólumot
talál),
M balra mozdul és egy
-szimbólumot
talál),
Az M kezdokongurációja x bemenet mellett mindig z0 x, az M termináló kongurá-
αzβ alakúak, ahol z ∈ F és α, β ∈ Γ∗ . 0 0 ∗ ∗ Legyen ` M reexív, tranzitív lezártja ` M . Eszerint k, k ∈ K M -re k ` M k akkor és csak akkor, ha létezik egy véges k0 , k1 , . . . , kt K M -beli konguráció-sorozat, melyre ciói x bemenet mellett pedig
k ahol lehetséges, hogy k k0
=
=
k0
= k0 ` M
=
kt
=
k1
`M · · · `M
kt
= k0 ,
0
k . Ha az M kezdokongurációja x bemenet mellett
0
z0 x, akkor ezt a sorozatot M(x) véges kiszámításának nevezzük, ha a k -beli állapot
végállapot, és azt mondjuk, hogy M megáll az x bemenetre. Az M által elfogadott nyelvet a következoképp deniáljuk: L(M)
= { x ∈ Σ∗ | z0 x `∗M αzβ, z ∈
F és
α, β ∈ Γ∗ }.
Az M termináló állapotainak F halmazát feloszthatjuk az F a elfogadó végállapotok és a F r
= Fa ∪ Fr és Fa ∩ Fr = ∅. Ebben az esetben = { x ∈ Σ∗ | z0 x `∗M αzβ, z ∈ Fa és α, β ∈ Γ∗ } az M által elfogadott nyelv. ∗ ∗ ∗ Az M kiszámít egy f : Σ → ∆ szófüggvényt, amennyiben minden x ∈ Σ -ra és minden ∗ y ∈ ∆ -ra elutasító végállapotok halmazaira, ahol F L(M)
∈ D f ⇐⇒
1.
x
2.
minden x
M az x bemenet mellett véges sok lépésben megáll,
∈ D f -re:
f (x)
= y ⇐⇒
z0 x
`∗M
zy egy megfelelo z
∈
F-re,
129
4.1. Alapok
(z0 , a) (z1 , a) (z1 , b) (z1 $)
(z2 , b) (z2 , c)
7→ 7 → 7 → 7 → 7 → 7 →
(z1 , $, R)
(z2 , $)
7→ 7 → (z3 , ) → 7 (z4 , $) → 7 (z4 , ) → 7 (z4 , c) → 7
(z1 , a, R)
(z3 , c)
(z2 , $, R) (z1 , $, R) (z2 , b, R) (z3 , $, R)
4.2. ábra. Az M Turing-gép L
(z2 , $, R) (z3 , c, R)
(z4 , , L) (z4 , $, L)
(z6 , , R) (z5 , c, L)
(z5 , c)
7→ 7 → (z5 , b) → 7 (z5 , a) → 7 (z5 , ) → 7 (z0 , $) → 7 (z5 , $)
(z5 , c, L)
(z5 , $, L) (z5 , b, L) (z5 , a, L)
(z0 , , R) (z0 , $, R)
= {an bn cn | n ≥ 1} nyelvhez tartozó δ parancsai.
ahol D f az f értelmezési tartományát jelöli. Azokat a szófüggvényeket, melyeket egy Turinggép kiszámít, kiszámítható szófüggvényeknek nevezzük. Egy f : mítható, ha egy g : {0, 1, #}
∗
→ {0, 1}
∗
Nk → N függvény kiszá-
,
g(bin(x1 )#bin(x2 )# · · · #bin(xk ))
= bin( f (x1 , x2 , . . . , xk ))
által deniált g szófüggvények segítségével kiszámítható. A bin(n) jelölés az n
∈ N kettes = 10001.
számrendszerbeli ábrázolását jelenti felvezeto nullák nélkül, mint például bin(17)
kongurációval rendelkezhet, Mivel egy NTM minden kongurációja több rákövetkezo ezért természetesen adódik egy kiszámítási fa, melynek gyökere a kezdokonguráció, levelei pedig a termináló kongurációk. A fák speciális gráfok (lásd a 3.8. deníciót a 3.1.3. állnak. Az M kiszámítási pontban, valamint a 3-2. feladatot), tehát csúcsokból és élekbol
0
fájának csúcsai megfelelnek az M x bemenet melletti kongurációi. Két k és k kongu-
0
ráció között pontosan akkor vezet egy irányított él k-ból k -be, ha k kiszámítási fájában egy k0
`M
k1
`M · · · `M
kt
`M · · ·
`M
0
k . Egy út az M
konguráció-sorozat, tehát M(x)
egy számításának felel meg. Egy NTM kiszámítási fája tartalmazhat végtelen utakat. Egy DTM esetében a kezdokonguráció kivételével minden kongurációt egyértelmuen (deter o kongurációja, ezért a kiszámítási fa elfajul egy minisztikusan) meghatározza a megeloz lineáris lánccá. A lánc a kezdokongurációval indul, és amennyiben a gép megáll az adott esetben pedig a lánc végtelen. bemenetre a termináló kongurációval végzodik, ellenkezo 4.1. példa.
L Turing-gép. Legyen egy L nyelv a következo:
= {an bn cn n ≥ 1}.
Egy, az L nyelvet
elfogadó Turing-gép deníciója az M ahol a
= ({a, b, c}, {a, b, c, $, }, {z0 , z1 , . . . , z6 }, δ, z0 , , {z6 }),
δ átmenetfüggvénynek megfelelo Turing-gép parancsok listáját a 4.2. ábra tartalmazza. A 4.3.
ábra egyenként jellemzi az M állapotait azok jelentésével, valamint a hozzájuk tartozó elvégzendo lépésekkel.
A bonyolultságelmélet szakemberei alapos emberek, szívesen teszik rendbe, foglalják rendszerbe a fontos problémák óriási, változatos halmazát. Ezen cél érdekében osztályoz zák és katalogizálják a problémákat, majd bonyolultsági osztályokba sorolják oket. Minden egyes ilyen osztályba olyan problémák kerülnek, melyek a megoldásukhoz egy meghatározott bonyolultsági mérték szerint nagyjából azonos ráfordításokat igényelnek. A legelterjedtebb bonyolultsági mértékek az idomérték (egy algoritmus által a megoldáshoz szükséges lépések száma) és a tármérték (a számítógépen szükséges tárhely). Mi most az idomérték tárgyalására szorítkozunk.
130
4. Bonyolultságelmélet
Z
Teendo
Jelentés
z0
kezdoállapot
új ciklust kezdeni
z1
felismertük a-t
b-t megkeresni a következo
z2
együttesen felismertük a, b-t
c-t megkeresni a következo
z3
a, b, c ki van írva
z4
jobb oldali szélre értünk
visszalépni és ellenorizni, hogy minden a, b, c ki van-e írva
z5
a teszt sikertelen
visszalépni a bal szélre és új ciklust kezdeni
z6
a teszt sikerült
elfogadás
megkeresni a jobb oldali szélt
4.3. ábra. Az M állapotainak értelmezése.
fogalmán az elvégzett lépések száAz algoritmus által a megoldáshoz szükséges ido mát értjük, mint a bemenet méretének függvényét. Formális modellünk, a Turing-gép esetében egy lépés a Turing-gép
δ
átmenetfüggvényének egyszeri alkalmazását jelenti, tehát
a számítás egy kongurációjának átmenetét a következobe. Esetünkben a hagyományos legrosszabb eset bonyolultsági modell vizsgálatára szorítkozunk. Ennek megfeleloen egy Turing-gép idofüggvényéhez a lehetséges tetszoleges n hosszú bemenetek közül azokat a hatású bemeneteket vizsgáljuk, melyek mellett a gép a legtöbb lépést igényli tehát a dönto legrosszabb esetet feltételezzük. Ezzel ellentétben átlagos eset bonyolultság esetén egy al goritmus várható futási idejét mint egy (tetszolegesen választott méretu bemenethez adott) átlagot kezeljük. valószínuségi eloszlásnak megfelelo A következokben deniáljuk a determinisztikus és nemdeterminisztikus idobonyolultsági osztályokat. 4.3. deníció (determinisztikus és nemdeterminisztikus idobonyolultság).
•
⊆ Σ∗ , valamint legyen x ∈ Σ∗ egy bemenet. Deniál∗ M(x) idofüggvényét, amely Σ -ból N-be képez a következoképp:
Legyen M egy DTM, melyre L(M) juk az
( Time M (x)
=
m,
ha M(x) pontosan m
nem deniált
egyébként .
+ 1 kongurációval rendelkezik
N → N függvényt: max x:| x|=n Time M (x), ha Time M (x) deniált minden | x| = n méretu x-re , = nem deniált egyébként .
Deniáljuk a time M :
time M (n)
•
⊆ Σ∗ , valamint legyen x ∈ Σ∗ egy bemenet. Deniál∗ juk az M(x) idofüggvényét, amely Σ -ból N-be képez a következoképp: ( min{Time M (x, α) | M az α úton elfogadja x-et}, ha x ∈ L(M), NTime M (x) = Legyen M egy NTM, melyre L(M)
nem deniált,
Deniáljuk az NTime M :
ntime M (n)
=
egyébként.
N → N függvényt:
max x:| x|=n NTime M (x)
ha NTime M (x) értelmezve van minden olyan x−re, melyre, | x|
nem deniált,
egyébként.
=n,
,
131
4.1. Alapok
t(n) n
n
= 10
n
= 20
n
= 30
n
= 40
n
= 50
n
= 60
.00001 mp
.00002 mp
.00003 mp
.00004 mp
.00005 mp
.00006 mp
2
.0001 mp
.0004 mp
.0009 mp
.0016 mp
.0025 mp
.0036 mp
3
.001 mp
.008 mp
.027 mp
.064 mp
.125 mp
.256 mp
5
.1 mp
3.2 mp
24.3 mp
1.7 perc
5.2 perc
13.0 perc
n
.001 mp
1.0 mp
17.9 perc
12.7 nap
n
.059 mp
58 perc
6.5 év
3855 évszd
n n n 2 3
35.7 év 2
· 108
366 évszd 1.3
évszd
· 1013
évszd
4.4. ábra. Néhány polinomiális és exponenciális idofüggvény összevetése.
•
Legyen t egy
N-bol N-be képezo kiszámítható függvény. Deniáljuk a determinisztikus
és a nemdeterminisztikus idobonyolultsági osztályokat t idofüggvény mellett a következoképp:
( DTIME(t)
=
NTIME(t)
=
A
(
•
A
A
=
minden n A
=
)
L(M) egy M DTM-el és
∈ N-re time M (n) ≤ t(n)
L(M) egy M NTM-el és
minden n
∈ N-re ntime M (n) ≤ t(n)
, ) .
Legyen IPol az összes polinom halmaza. Deniáljuk a P és NP bonyolultsági osztályokat a következoképp: P
=
[ DTIME(t)
és
t∈IPol
NP
=
[
NTIME(t).
t∈IPol
DPTM-el illetve NPTM-el jelöljük a polinomiális ideju DTM-eket illetve NTM-eket. Miért is olyan fontosak a P és az NP polinom ideju osztályok? Nyilvánvaló, hogy az ex hatékonynak. A 4.4. ábponenciális futási ideju algoritmusok általában bajosan nevezhetok rán összehasonlítjuk néhány polinomiális és exponenciális idofüggvény növekedési ütemét, indugyakorlati szempontból fontos bemeneti méretekre. Ehhez egy olyan számítógépbol lunk ki, amely másodpercenként egymillió muvelet elvégzésére képes. Látható, hogy míg a = 60 méretéig elfogadható ido alatt eloállítják
polinomiális ideju algoritmusok a bemenet n az eredményt, addig például egy t(n) szerényebb, n
=
=
n
3
futási ideju algoritmus a bemenet viszonylag
=
30 méreténél 6 évnél is tovább dolgozna, az n
már majdnem 400 évezredre, és körülbelül n
=
40 méretu problémákhoz
pedig valóban csillagászati mértéku 50-tol
idore lenne szüksége. o Az utóbbi évtizedekben a számítógéptudományok és a hardver-technológia meggyoz fejlodését gyelhettük meg. Ha azonban fel is tesszük, hogy a gyorsabb és gyorsabb processzorok fejlesztési üteme megmarad az eddigi szinten, a 4.5. ábra szerint ez sem segít lényegesen az exponenciális futási ideju algoritmusok teljes végrehajtási idejének csökkentésében. Mi történne, ha egy olyan számítógépet használnánk, amely 100-szor vagy akár 1000-szer gyorsabb napjaink leggyorsabb számítógépeinél? Egy ti (n), 1
≤i≤
6 függvény-
hez jelölje Ni azt a maximális feladatméretet, amelyet egy ti (n) idofüggvény u algoritmus egy órán belül meg tud oldani. A 4.5. ábra alapján látható, hogy még ezerszeres sebességnövekedés is csak körülbelül tízzel növeli N5 értékét t5 (n) 5
egy n
=
n
2
esetén. Ezzel szemben
idofüggvény u algoritmus ugyanekkora sebességnövekedést feltételezve hozzáveto-
leg négyszer nagyobb problémákat tud megoldani egy óra alatt.
132
4. Bonyolultságelmélet
ti (n)
Mai számítógép 100-szor gyorsabb 1000-szer gyorsabb
=n 2 t2 (n) = n 3 t3 (n) = n 5 t4 (n) = n n t5 (n) = 2 n t6 (n) = 3 t1 (n)
N1 N2 N3 N4 N5 N6
· N1 · N2 4.64 · N3 2.5 · N4 N5 + 6.64 N6 + 4.19 100
1000
10
31.6
· N1 · N2
· N3 · N4 N5 + 9.97 N6 + 6.29 10
3.98
4.5. ábra. Mi lenne, ha a számítógépek gyorsabbak lennének?
dogma azt a széles körben elterjedt nézetet fogalmazza meg, miszerint A következo a polinomiális ideju algoritmusok hatékonynak tekinthetok, míg a csak exponenciális alsó algoritmusok kimondottan rosszak, hatékonynak nem nevezhetok. korláttal rendelkezo 4.4. dogma. A polinomiális ido a hatékonyság intuitív fogalmának felel meg. Az exponenciális ido a rossz hatékonyság intuitív fogalmának felel meg. Természetesen egy dogma mindig is csak egy dogma marad, ennélfogva 4.4.-et is kri77
10
tikusan kell szemlélnünk. Egy n nézve egy
N
lépésben dolgozó algoritmus például ugyan formálisan
feletti, polinom lépésszámú algoritmus, de a polinom fokszáma éppen olyan
összes atom mostanság becsült darabszáma. nagy, mint az egész látható univerzumban lévo Emiatt egy ilyen algoritmus egyáltalán nem hatékony, használata még a legkisebb problé0.00001·n
maméret mellett is gyakorlatilag értelmetlen. Másrészt viszont egy 2
exponenciális
idokorlát éppenséggel elfogadható lehet a gyakorlatban fontos problémaméretek mellett. Természetesen, ha valamikor is jelentkezik az exponenciális növekedés, a 0.00001
·n
ki-
esetében ez eloször tevo csak nagyon nagy n mellett esedékes. Ez a két szélsoséges eset a A természetes P-beli problémák lenyuvalóságban mindenesetre szinte soha nem fordul elo. többsége megoldható olyan algoritmussal, aminek futási ideje alacsony fokú polinom, gözo 2
3
mint O(n ) vagy O(n ). Negyed-, ötöd- vagy ennél magasabb fokú polinomok csak nagyon ritkán lépnek fel. A P osztály a 4.4. dogma szerint pontosan a hatékonyan megoldható problémákat tartalmazza. Az NP osztály sok olyan, gyakorlatban fontos problémát tartalmaz, melyekre a mai napig nem találtak hatékony megoldó algoritmust, mint például a kielégíthetoség és a grázomorzmus problémái. Ezeket a 4. fejezetben részletesen vizsgáljuk. A kérdés, hogy a P és NP osztályok azonosak-e, szintén máig megoldatlan. Ez a híres PNP probléma, amit tekinthetünk az elméleti informatika legfontosabb máig nyitott kérdésének. A kérdés különösen nagy szerepet játszik a kriptográa területén, mivel a legtöbb ma használatos titkosítási rendszer azon a feltevésen alapszik, hogy bizonyos problémák nehezen megoldhatók. Ide tartoznak a faktorizálási probléma és a diszkrét logaritmus problémája, melyeket a 3. fejezetben vizsgálunk részletesebben. Amennyiben sikerülne a P
= NP egyenloséget bi-
zonyítani, minden ilyen titkosítási rendszer elvesztené biztonságos tulajdonságát, és ezáltal haszontalanná válna. A PNP kérdés különösen nagy szerepet játszott az NP-teljesség elméletének létrejöttében. Ez az elmélet módszereket biztosít a legnehezebb NP-beli problémák alsó korlátainak bizonyításához. Egy ilyen bizonyításnál egyetlen egy nehéz NP-beli problémából kell kiindulni. Számos további NP-probléma NP-nehézsége ezután egy visszavezetés segítségével következik, ami során egy problémát egy másikká alakítunk át. Érdekes módon mivel
133
4.2. NP-teljesség
ezek visszavezetések léteznek olyan hatékony algoritmusok, melyekkel lehetové válik a nehéz problémák NP-nehézségének bizonyítása. Azokat a problémákat, melyek NP-beliek és NP-nehezek, NP-teljes problémáknak nevezzük. Ezek nem tartozhatnak P-be, ezért nem is lehetnek hatékonyan megoldhatók, kivéve, ha esetleg P
=
NP fennáll. Az NP-teljesség
elméletét a 4.2. alfejezetben mutatjuk be.
Gyakorlatok 4.1-1. Be lehet-e bizonyítani a Church-tézist? A választ indokoljuk. M Turing-gépet. 4.1-2. Tekintsük a 4.1. példában szereplo (a) Adjuk meg M kongurációinak sorozatát x
=
3
3
2
a b c
,
illetve y
=
3
3
a b c
3
bemenet
mellett. (b) Bizonyítsuk be M helyességét, azaz igazoljuk az L(M)
= {an bn cn | n ≥ 1} egyenlo-
séget. (c) Adjunk becslést az M futási idejére. 4.1-3. Mutassuk meg, hogy a 3.8. denícióban szereplo
GI és GA problémák NP-beliek.
4.2. NP-teljesség Az NP-teljesség elmélete módszereket biztosít NP-beli problémák alsó korlátainak igazolásához. Egy NP-probléma NP-ben teljes, ha az osztály legnehezebb problémái közé tartozik. Ennél fogva egy X probléma NP-nehézségének belátásához NP összes problémáját össze kell hasonlítani X-el, és meg kell mutatni, hogy X legalább olyan nehéz, mint az aktuálisan vizsgált másik probléma. Két probléma bonyolultsága polinomiális ideju visszavezeté össze egymással. A sok különbözoképp sek segítségével mérheto deniálható visszavezet hetoségi típus közül számunkra most az úgynevezett sok-egy-visszavezethetoség lényeges, amit
p
≤m -vel
fogunk jelölni. Mivel ebben az alfejezetben nem foglalkozunk más vissza-
vezethetoségi osztállyal, ezért egyszeruen
beszélünk. A 4.4. alfevisszavezethetoség-r ol jezetben általánosabb visszavezethetoségeket is megismerhetünk, az úgynevezett Turingvisszavezethetoséget és az (eros) nemdeterminisztikus Turing-visszavezethetoséget. 4.5. deníció (visszavezethetoség, NP-teljesség). mazra (formálisan A melyre minden x ha minden A
∈
NP-teljes), ha B
p
≤m
∈ Σ∗
esetén x
NP halmazra A p
Egy A halmaz visszavezetheto egy B hal-
B, ha létezik egy polinomiális idoben kiszámítható r függvény,
∈
A
≤
p m
⇐⇒
r(x)
∈
B. Egy B halmaz
B. Egy B halmaz
≤m -nehéz NP-ben és B ∈ NP.
p m -teljes
≤
p
≤m -nehéz
NP-ben,
NP-ben (vagy röviden
Egy adott X probléma NP-nehézségének bizonyításhoz látszólag végtelen sok hatékony algoritmus szükséges, majd minden egyes ilyen NP-beli problémát hatékonyan vissza kell kutatási eredmény szerint azonban nem szükséges végtelen sok vezetni X-re. Egy alapveto ilyen visszavezetés elvégzése, elég egyetlen NP-teljes V probléma visszavezetése X-re. Miaz
p
≤m -visszavezethetoség tranzitív (lásd a 4.2-2. gyakorlatot) valamint V NP-nehéz, ezért p p A ≤m V ≤m X visszavezetéssel következik X NP-nehézsége. Itt A befutja az NP-beli
vel a
nyelveket. ilyen NP-teljes problémák egyikét, az ítélet1971-ben Stephen Cook megtalálta az elso logikai kifejezések kielégíthetoségének problémáját ( satisability problem), amit röviden SAT-tal jelölünk. Sok NP-teljességi bizonyításhoz elég, ha a kielégíthetoség probléma egy
134
4. Bonyolultságelmélet
úgynevezett
3-SAT
megszorításából indulunk ki, ahol az adott Boole-formulák konjunktív
normálformában állnak rendelkezésre, és minden klóz pontosan három literált tartalmaz. A
3-SAT is NP-teljes. A diszjunktív normálformájú Boole-kifejezések kielégíthetoségének
eldöntése hatékonyan megoldható.
és az Boole-konstansokat rendre 0∈ {0, 1} minden i-re. A változókat és azok negáltját literáloknak nevezzük. Egy ϕ Boole-formula kielégítheto, ha létezik ϕ változóinak olyan behelyettesítése, ami a formulát igazzá teszi. Egy ϕ Boole Vn Wk formula konjunktív normálformájú (röviden KNF,) ha ϕ(x1 , x2 , . . . , xm ) = ` i=1 j=1 i, j Wk formájú, ahol az `i, j literálok { x1 , x2 , . . . , xm }-bol valók. A literálok ` diszjunkcióit ϕ j=1 i, j klózainak hívjuk. Egy ϕ Boole-formula k-KNF, ha ϕ KNF és ϕ minden klóza pontosan k 4.6. deníció (kielégíthetoség probléma). A
val és 1-gyel jelöljük. Legyenek x1 , x2 , . . . , xm Boole-változók, tehát xi
i
i
literált tartalmaz. Deniáljuk a következo két problémahalmazt:
SAT = 3-SAT =
{ϕ | ϕ kielégítheto KNF Boole-formula} , {ϕ | ϕ kielégítheto 3-KNF Boole-formula} .
két formula kielégítheto Boole-kifejezés (lásd még a 4.2-1. 4.2. példa. Boole-kifejezések. A következo gyakorlatot):
Itt
ϕ(w, x, y, z)
=
(x
ψ(w, x, y, z)
=
(¬w
∨ y ∨ ¬z) ∧ (x ∨ ¬y ∨ ¬z) ∧ (w ∨ ¬y ∨ z) ∧ (¬w ∨ ¬ x ∨ z)
;
∨ x ∨ ¬y ∨ z) ∧ (x ∨ y ∨ ¬z) ∧ (¬w ∨ y ∨ z) ∧ (w ∨ ¬ x ∨ ¬z) .
ϕ egy 3-KNF formula, ezért ϕ 3-SAT-beli. Ezzel szemben ψ nem 3-KNF, mivel az elso klóz négy ψ ugyan SAT-beli, de nem 3-SAT-beli.
literált tartalmaz, ezért
között adott meg A 4.7. tétel Cook korábban említett eredménye, amelyben az elsok
SAT-tal
egy NP-teljes problémát. A bizonyítás alapötlete szerint kódoljuk egy tetszoleges
M NPTM muködését egy
ϕ M, x
Boole-formulával úgy, hogy
ϕ M, x
pontosan azon x-ekre le-
az x bemenettel, melyeket az M elfogad. A kielégíthetoség gyen kielégítheto problémából kiinduló visszavezetésekhez sokszor célszeru, ha az adott kifejezések szigorú 3-KNF formában állnak rendelkezésre. Ez megoldható, mivel
SAT visszavezetheto 3-SAT-ra, ezért 3-SAT
fejezetét). szintén NP-teljes (lásd az Új algoritmusok megfelelo 4.7. tétel (Cook). A
SAT és 3-SAT problémák NP-teljesek.
Napjainkra több ezer NP-teljes problémát találtak már. Mi most a nagy választékból szemléltetési célokra a háromdimenziós párosítás problémát választjuk ki, és egy
3-SAT-
ból való visszavezetéssel megmutatjuk NP-teljességét. A párosítási feladatoknál egymás párokat vagy hármasokat alakítunk ki. Egy kétdimenziós (vagy bipartite) párosítás hoz illo párok halmaza, egy háromdimenziós (vagy tripartite) párosítás, más néven egymáshoz illo hármasok halmaza. Kétdimenziós párosítások jól szemléltethehármasítás egymáshoz illo (irányítatlan) gráfokkal, lásd bovebben tok a 3.8. deníciót. 4.8. deníció (kétdimenziós párosítás probléma).
Egy 2n csúccsal rendelkezo G gráf pá-
ros, ha a csúcshalmaza két n méretu, diszjunkt V1 és V2 halmazra osztható, ahol mindketto független halmaz, azaz sem V1 , sem pedig V2 csúcsai nincsenek élekkel összekötve. Csak
135
4.2. NP-teljesség
¯ b 1 f2
m1
f3
m2
b1 f1
b2
m2 f2
m1 ¯ b 4
f1
m3
f4
m4
¯ b 2 m3
f4 f3
m4 b4
b3 ¯ b 3
4.6. ábra. Balra: A házasítás probléma megoldása. Jobbra: Az R reláció igazságérték-komponensei.
V1 és V2 -beli csúcsok között fordulhat elo él. G tökéletes kétdimenziós párosítása egy olyan n csúcsú M (v, x
∈ V1 ,
⊆
w, y
{v, w} és { x, y} M-beli élre , y. A kétdimenziós párosítás probléma kérdése az, hogy
E(G) halmaz, melynél minden két különbözo
∈ W2 ) v ,
x és w
egy adott páros gráfhoz létezik-e kétdimenziós párosítás.
4.3. példa. (Kétdimenziós párosítás probléma.)
Képzeljünk el n darab házasodni szándékozó höl-
gyet és n darab házasodni szándékozó fért, akik egy páros gráf csúcsait alkotják. A V (G) csúcshalmaz tehát két részre bomlik, Vvolegény V (G)
=
Vmenyasszony
∪ Vvolegény
= { f1 , f2 , . . . , fn } és Vmenyasszony = {m1 , m2 , . . . , mn }, valamint ∩ Vvolegény = ∅. A Vvolegény -beli és a Vmenyasszony
és Vmenyasszony
beli csúcsokat élek köthetik össze, de nincs él Vvolegény -beli csúcsok vagy Vmenyasszony -beli csúcsok ha rendezheto n darab esküvo az n menyasszony és között. Egy kétdimenziós párosítás akkor áll elo, idézve) n volegény között úgy, hogy (Garey és Johnson muvéb ol
valamint a poligámia elkerülendo, mindenki elfogadható feleséget illetve férjet kapjon. Emiatt az értelmezés miatt a kétdimenziós párosítás problémát házasítás problémának is nevezzük. A 4.6. ábrán (bal oldalon) látható a házasítás
probléma egy megoldása, ahol a vastagon nyomtatott élek a négy új házaspárt jelölik. Ismert, hogy a házasítás probléma hatékonyan megoldható. A valós élet gyakran igazolja az állítást: Házasodni könnyu!
A következokben általánosítjuk a páros gráfokat és a kétdimenziós párosításokat három dimenzióra.
4.9. deníció (háromdimenziós párosítás probléma). Legyen U , V és W három, páronként
⊆ U × V × W egy hármas reláció, tehát (u, v, w) hárma∈ W . R egy háromdimenziós párosítása egy n méretu különbözo (u, v, w) és (u , v , w) hármasra u , u, v , v és
diszjunkt, n méretu halmaz. Legyen R sok halmaza, ahol u M w
∈ U, v ∈ V
és w
⊆ R halmaz, ahol minden két , w. Ez azt jelenti, hogy egy háromdimenziós párosítás semelyik két eleme nem illeszked-
het egymáshoz valamely koordinátájában. Deniáljuk tehát a háromdimenziós párosítás
136
4. Bonyolultságelmélet
problémát a következoképp:
3-DM
= (R, U, V, W )
U , V és W páronként diszjunkt, nem üres, azonos méretu halmaz és R
⊆U ×V ×W
egy hármas reláció, amely
egy |U | méretu háromdimenziós párosítást tartalmaz
.
4.4. példa. Háromdimenziós párosítás probléma. Kilenc hónap telt el. Egy reggel az n darab boldog születik, akik hangos sírás házastárspárunk útra kel a kórházba. Néhány órával késobb n csecsemo mellett rögtön jelentosen megnövelik szüleik életének bonyolultságát például azáltal, hogy elcseré lik a névtáblájukat, amin rajta áll, hogy melyik szülopárhoz tartoznak. Ez nagy zurzavarhoz vezet a szüloszobában. Még tovább rontva a helyzeten az újdonsült apák mindegyike talán az izgalmas szépségétol elcsábítva kijelenti, hogy sosem látta azt a hölpillanatoktól összezavarva és a többi no gyermekét hozta épp világra. Ehelyett hutlen gyet, aki makacsul kitart amellett, hogy az o módon mellett közvetlenül balra fekszik. A káosz kijelenti, hogy egy másik hölgy a házastársa, aki az elso ovére teljes! A szüloszoba fon nehéz problémával szembesül: melyik szülopároshoz melyik csecsemo tartozik? Másképp fogalmazva n darab boldog, harmonikus és páronként diszjunkt családot kell újra összeállítania, tehát egy háromdimenziós párosítás feladatot kell megoldania n édesapa, n édesanya és között. Nem csoda, hogy szemben a kétdimenziós párosítás feladat hatékony megoldn csecsemo ovérnek hatóságával a 3-DM probléma NP-teljes. Végül a fon 3n darab vérvételt és kinomult DNS teszteket kell elvégeznie, ám ennek tárgyalása már meghaladná könyvünk terjedelmét. Ismét átfogalmazva a 3-DM NP-teljességét a valós élet tapasztalataira: Ha jönnek a gyermekek, nagyon nehéz feladat boldog és harmonikus, diszjunkt családokban élni!
4.10. tétel. A 3-DM probléma NP-teljes. Bizonyítás. A 4.2-4. gyakorlat szerint könnyen belátható, hogy 3-DM NP-beli. A 3-DM NP nehézségének bizonyítása mögötti intuíciót legkönnyebb akkor megérteni, ha eloször meg ovér nézzük, hogyan jár el a szüloszobai fon a háromdimenziós párosítás probléma megoldá sakor. Eloször is mindenkit ellát a teremben egy névtáblával, olyannal, ami megbízhatóan nem fog ismét eltunni. Feltesszük, hogy az édesanyák az m1 , m2 , . . . , mn , az édesapák az pedig a b1 , b2 , . . . , bn elnevezéseket kapják. Ezután a fon ovér f1 , f2 , . . . , fn , a csecsemok ¯ ,b ¯ ,...,b ¯ } csecsemot ¯ a b -vel megegyezo állít elo, ahol minden egyes b egy újabb adag {b 1 2 n i i 2
klón , azaz ugyanúgy néz ki, és a DNS-e bi -vel azonos öröklodési információkat tartalmaz. A 2n darab szülo egy belso kört formáz, Ezt elvégezve két kört alakít ki a 4n emberbol. körben az n csecsemo és n klónja helyezkedik amiben apák és anyák váltakoznak. A külso el, ugyancsak váltakozva. A két kör szomszédos személyei kapcsolatban állnak egymással úgy, ahogy a 4.6. ábra (jobb oldalon) n
= 4 esetében mutatja: minden apa két anyával és két
csecsemovel van összekötve. gondolatmenetben az i indexek modulo n értendok, A következo a példában n 3
Vizsgáljunk minden i-t, melyre i modulo n
= 4. Az
= 4.
fi -edik apa az mi−1 -edik anyával tartja
magát házasnak, és vele közös gyermekének pedig az (i
−
Ezzel szemben 1) csecsemot.
az mi anya ahhoz ragaszkodik, hogy o az fi apa felesége, és a közös gyermekük pedig az Mindkét ellentmondó állítást egy-egy háromszög szemlélteti a 4.6. ábrán i-edik csecsemo. ¯ (jobb oldalon), melyek csúcsai fi , mi−1 és b i−1 , illetve mi , fi és bi . A 2n darab háromszög
2
etikai kérdések szintén túlmutatnak A csecsemoklónozás technikai kérdései és az ezzel kapcsolatban felmerülo ezen könyv határain, ennélfogva szép csendben mellozzük oket. 3
A modulo n aritmetikáját a 3. fejezet végén, a 3-1. példával kapcsolatban ismertettük.
137
4.2. NP-teljesség
ovérnek mindegyike egy-egy potenciális családot képez. A fon azt kell megállapítania, hogy mely háromszögek reprezentálják az eredeti n darab családot, és melyek nem. Az egyet len lehetoség n darab diszjunkt család létrehozására az, ha vagy minden háromszögbe egy ¯ klóncsecsemot vagy pedig minden háromszögbe egy b választunk. Azáltal, b csecsemot, i
i
ovér hogy a 3n vérvételt és a fentebb említett DNS-teszteket elvégezte, a fon meghozhatja ovér a helyes döntést és minden apához kijelölheti igazi feleségét és igazi gyermekét. A fon az n darab eredeti családot. A fennmaradó n darab csecsemot (és ez a tehát így állítja elo ovér fon módszerének szomorú oldala és a csecsemoklónozásé úgy általában) adoptálják, vagy árvaházakban helyezik el. A bonyolultságelmélettel foglalkozók nem nagyon értenek a DNS-tesztekhez vagy a klónozáshoz, szerencsére azonban a kielégíthetoség-problémát jól ismerik. A 3-DM prob-
3-SAT egy visszavezetését 3-DM-re. Legyen ϕ(x1 , x2 , . . . , x` ) = C1 ∧ C2 ∧ · · · ∧ Cn , ahol
léma NP-nehézségének belátásához deniáljuk
ϕ
adott
Boole-formula 3-KNF-ben, vagyis
ϕ minden C j klóza pontosan három literált tartalmaz. Eloállítandó polinomiális idoben egy ahol R ⊆ U × V × W egy hármas reláció a páronként diszjunkt, (R, U, V, W ) négyes 3-DM-bol, nem üres, azonos méretu U , V és W halmazokkal úgy, hogy
ϕ kielégítheto ⇐⇒
R egy |U | méretu, M háromdimenziós párosítást tartalmaz
.
(4.1)
jellegu R különbözo hármasokból áll, melyek mögött mindig más és más szándék rejto zik. Azonos jellegu hármasokat elem-csoportokká, komponensekké fogunk össze. Az elso
ϕ formula változóinak olyan ϕ összes klózára nézve. Ennek
ilyen komponens azokból az R-beli hármasokból áll, melyek meghatározott hozzárendelését biztosítják, ami konzisztens
klózokban, akkor minden egyes megfeleloen ha ugyanaz a változó elofordul különbözo ilyen eloforduláshoz ugyanazt az igazságértéket kell hozzárendelni, ennélfogva ezeket az igazságérték-komponensnek nevezzük. alkotóelemeket R-bol Minden ϕ-beli xi változóhoz készítünk pontosan 2n darab U -beli b , b , . . . , bn és 1 2 ¯ i pedig ¬ x ¯i , b ¯i , . . . , b ¯ i elemet, ahol n a ϕ klózainak száma. A bi reprezentálja x , a b b i i n j j i
1
i
i
2
ϕ j-edik C j klózában. Mivel az összes literál nem fordul elo minden klózban, i ¯ i nem feleltetheto meg valamely ϕ-beli literál elofordulásának. Ezeezért néhány b j vagy b j
elofordulását
ϕ-beli xi változóhoz létrehozunk további n darab V -beli mi1 , mi2 , . . . , min i i i belso kört és n darab W -beli f , f , . . . , fn elemet, melyek a 4.6. ábrán (jobb oldalon) lévo 1 2 alkotják, ha n = 4 és az ábrán nem szerepelnek a fenti indexek. Kapcsoljuk most össze ken kívül minden
i
i
i
i
¯i és b
i j− 1
az m j , f j és b j , továbbá az f j , m
j−1
elemeket egymással, ahogy a 4.6. jobb oldali
ábráján vázoltuk. Az így létrehozott komponensek háromszögei megfelelnek az R hármai
i
körbol m és f csak azokban a komponensekben fordulnak elo, melyek sainak. A belso j j i ¯ i más komponensekben is körbol b és b az xi változónak felelnek meg, miközben a külso j j
elofordulhatnak. Formálisan az X igazságérték-komponensek X Xi
=
Fi
∪ Ti
minden
=
S`
i=1
Xi alakúak, ahol
ϕ-beli xi -re, a következo két halmaz által deniálva:
Fi
= {(bij , mij ,
Ti
¯i (b j
= { i
,
i mj
,
i
fj) | 1 i f j+1 )
≤ j ≤ n} ;
| 1 ≤ j < n} ∪ {(b¯ in , min ,
i
f1 ) }
.
i
kör m és f elemei csak Xi komponenseiként szerepelhetnek, ezért R minMivel a belso j j den M párosítása pontosan n darab hármast tartalmaz, vagy minden ilyen hármast F i -bol,
138
4. Bonyolultságelmélet
Az F i és T i közötti választás biztosítja az xi változók megfevagy minden hármast T i -bol. leltetését az igaz vagy a hamis értékeknek. Mivel Xi tartalmazza
ϕ összes
xi elofordulását,
ezért ez a választás az egész formulára nézve konzisztens, következésképp R minden egyes M párosítása a
ϕ
formula egy hozzárendelését határozza meg úgy, hogy a hozzárendelés
minden xi változója akkor és csak akkor lehet igaz, ha M
ϕ
=
Sn
∩ Xi = T i .
Y j hármasok halmazát úgy, hogy minden Y j a j=1 C j klózát ellenorizze. megfelelo Ennek megfeleloen az Y komponenst R kielégíthetoségi Most hozzáillesztjük R-hez az Y
∈
komponensének nevezzük. Minden C j klózhoz készítünk két v j
V és w j
∈
W ele-
Ezen kívül Y j három további elemet tartalmaz az met, melyek csak Y j -ben fordulnak elo.
S` i {b j } ∪ {b¯ ij } halmazból, melyek megfelelnek C j három literáljának, és R más kompoi=1 halmazzal nenseiben is elofordulhatnak. Formálisan Y j -t ϕ minden C j klózára a következo deniáljuk:
{(bij , v j , w j ) | xi
=
Yj
Mivel a v j és w j (1
≤
j
elofordul C j -ben}
≤
∪ {(b¯ ij , v j , w j ) | ¬ xi
elofordul C j -ben}
.
különn) elemek egyike sem szerepelhet az R halmaz Y j -tol
bármelyik másik hármasában, ezért R minden M háromdimenziós párosítása pontosan bözo i ¯ i , v , w )-t. Továbbá M ponegy Y -beli hármast tartalmaz, vagy (b , v , w )-t, vagy pedig (b j
j
j
j
j
j
j
i
C j -ben), vagy pedig tosan akkor tartalmaz egy Y j -beli hármast vagy b j -t (ha xi elofordul ¯ i -t (ha b j
¬ xi fordul elo C j -ben) ha ez az elem nem fordul elo az M ∩ Xi hármasai között. Ez
pedig pontosan akkor következik be, ha az M igazságérték-komponensével meghatározott hozzárendelés kielégíti a C j klózt. Mostanra U pontosan 2n` elemet tartalmaz, azonban V és W mindössze n`
+ n elemu. − 1) elemmel V -t és W -t, amivel a három halmaz azonos méretu lesz. hozzáadjuk a vn+1 , vn+2 , . . . , vn` elemeket V -hez, valamint a wn+1 , wn+2 , . . . , wn`
Bovítsük további n(` Eloször is
halmazával: elemeket W -hez. Ezeken kívül kiegészítjük R-et hármasok következo Z
= {(bij , vk , wk ) | 1 ≤ i ≤ ` és 1 ≤ j ≤ n és n + 1 ≤ k ≤ n`} ∪ {(b¯ ij , vk , wk ) | 1 ≤ i ≤ ` és 1 ≤ j ≤ n és n + 1 ≤ k ≤ n`} .
A vicc pedig az, hogy ha létezik R
−Z
egy háromdimenziós párosítása, és az összes,
R igazságérték- és kielégíthetoségi-komponenseivel biztosított feltétel teljesül, akkor ez a háromdimenziós párosítás U -ból pontosan n(`
− 1)
elemet szabadon hagy, amit aztán egy
egyértelmuen meghatározott Z-beli (vk , wk ) párral
párosíthatunk. Az R − Z háromdimen ziós párosításainak ilyen bovítése R egy háromdimenziós párosítását adja. Formálisan az U ,
V és W halmazokat a következoképp deniáljuk: U
= {bij | 1 ≤ i ≤ ` és 1 ≤ j ≤ n} ∪ {b¯ ij | 1 ≤ i ≤ ` és 1 ≤ j ≤ n} ;
V
= {mij | 1 ≤ i ≤ ` és 1 ≤ j ≤ n} ∪ {vk | 1 ≤ k ≤ n`}
W
;
= { f ji | 1 ≤ i ≤ ` és 1 ≤ j ≤ n} ∪ {wk | 1 ≤ k ≤ n`} .
⊆ U ×V ×W relációt a R = X ∪Y ∪Z egyenloség határozza meg. Mivel R pontosan 2n`+ 2 3n + 2n `(` − 1) hármast tartalmaz, tehát polinomiális számút a ϕ formula méretére nézve, és ezért a visszavezetés polinomiális R szerkezete könnyen meghatározható ϕ szerkezetébol,
Az R
idoben kiszámítható. A (4.1) állítás következik az R konstrukciója közbeni észrevételekbol.
139
4.3. Az ítéletlogika kielégíthetoség-problémája
(4.1) formális bizonyítását a 4.2-5. gyakorlat keretében az Olvasóra bízzuk.
Gyakorlatok behelyettesítést a 4.2. példában szereplo 4.2-1. Adjunk meg egy-egy kielégíto
ϕ és ψ Boole-
formulákhoz. 4.2-2. Mutassuk meg az A
≤
p m
p
p
≤m -visszavezethetoség tranzitivitását: (A ≤m
B
p
∧ B ≤m
C)
=⇒
C.
4.2-3. Adjunk meg egy
p
SAT ≤m 3-SAT visszavezetést. Alakítsuk át hozzá egy adott Boole-
vagy háromnál több formula minden olyan klózát KNF klózzá, amely csak egy, csak ketto literált tartalmaz. Eközben a formula kielégíthetosége ne változzon. 4.2-4. Mutassuk meg, hogy a
SAT és 3-DM problémák NP-beliek.
(4.1) egyenloséget. 4.2-5. Lássuk be a 4.10. bizonyításban szereplo
4.3. Az ítéletlogika kielégíthet®ség-problémája 4.3.1. 3-SAT determinisztikus id®bonyolultsága SAT kielégíthetoség probléma és annak 3-SAT megszorítása a 4.7. tétel alapján NP-teljes. SAT esetleg P-beli lenne, akkor az általánosan elfogadott sejtéssel szemben P = NP rögtön következne, ezért nagyon valószínutlennek tunik, hogy léteznének SAT-hoz vagy 3-SATA
Ha
hoz hatékony determinisztikus algoritmusok. Akkor viszont mekkora a legjobb algoritmu-
3-SAT-ra? Mivel a formula pontos szerkezete nyilvánvalóan befolyásolhatja 3-SAT problémára koncentrálunk, ahol minden klóz k-SAT-ra, pontosan három literálból áll. Az itt bemutatott eredmények közvetlenül átvihetok SAT megszorítására pontosan k literállal klózonként. 3-SAT naiv determinisztikus algorit musa a következoképp muködik: egy adott n-változós ϕ Boole-formulánál egymás után az sok futási ideje
ezért mi ebben a pontban a futási idot,
összes lehetséges behelyettesítést kipróbáljuk, kiértékelve a formulát a mindenkori értékekkel. Ha n
a 2
ϕ
esetben mind valamely behelyettesítésre igaz, az algoritmus elfogad, ellenkezo
behelyettesítést eredmény nélkül kipróbálja, és az algoritmus elutasít. Ez a módszer n
nyilvánvalóan O(2 ) idovel dolgozik. Megoldható-e a probléma gyorsabban? megmutatnánk hogyan, a következo kérdést Igen, megoldható gyorsabban is. De mielott szeretnénk feltenni: miért? Mi haszna annak, ha n
valahová O(c )-re, ahol a c konstansra 1
n 3-SAT felso idokorlátját O(2 ) alá szorítjuk,
< c < 2 teljesül, ami még mindig egy exponenciá-
annak az n0 küszöbértéknek a hátrébb lis idokorlát? A haszon ott jelentkezik, hogy elérheto jellemzo lesz, azaz ahol az algoritmus abszolút tolása, ahonnan kezdve az exponenciális ido A 3-SAT naiv ≥ n0 méretu bemenetek mellett elviselhetetlenül nagyra no. n n algoritmusának O(2 ) korlátját hozzávetoleg annyira le lehet szorítani, hogy egy O(c ) al-
futási ideje n
alatt, ami goritmussal kétszeres méretu bemenetek feldolgozása válik lehetové azonos ido nagy gyakorlati jelentoséggel bír. Pontosan ez az eset áll fenn c
√
ahol az algoritmus O(
2
2n
)
=
n
=
√
2
≈ 1.4142
mellett,
O(2 ) idoben dolgozik (lásd még a 159. oldalon a
4.10.
táblázatot). A következokben bemutatunk egy algoritmust
3-SAT-hoz, amely a visszalépésen alapul.
Ez az algoritmusfejlesztési technika azon problémák megoldására alkalmas, ahol a meg tevodik oldás n darab alkotóelembol össze, melyeknél több választási lehetoség adódik.
140
4. Bonyolultságelmélet
Például
3-SAT
behelyettesítés, ami n darab igazságértékébol egy megoldása egy kielégíto
áll, továbbá minden ilyen igazságértékhez két választási lehetoség adódik:
vagy ,
illetve 1 vagy 0. Az ötlet ezután abból áll, hogy az üres megoldásból (részleges behelyette lépésre, a Backtracking-eljárás sítés, ahol a változók nincsenek kitöltve) kiindulva lépésrol rekurzív hívásával a probléma mind nagyobb részleges megoldását hozzuk létre, amíg meg rekurziós fában nem találjuk a teljes megoldást, már amennyiben az létezik. A keletkezo
4
a gyökeret megjelöljük az üres megoldással, a probléma teljes megoldásai pedig a levelek szintjére kerülnek. Ha az algoritmus végrehajtása során megállapítjuk, hogy a rekurziós fa aktuális ága
halott, vagyis az addig konstruált részmegoldás semmi esetben sem egészít ki a probléma teljes megoldásává, akkor az eddig elért csúcs alatti részfát nyugodtan leheto oleg vághatjuk. A meghívandó eljárást visszaléptethetjük, próbálkozhatunk az eloz konstru-
ált részmegoldás újabb folytatásával. Ennek a visszalépésnek köszönheti nevét a visszalépés algoritmikai elve. A rekurziós fa
tudunk megtakarítani. halott részeinek levágásával idot
B-SAT(ϕ, β) 1
β-ban ϕ minden változója ki van töltve then return ϕ(β) elseif β hamissá teszi ϕ egy klózát
if
2 3 4
B Halott ág.
then return 0 elseif B-SAT(ϕ, β0)
5 6
then return 1 else return B-SAT(ϕ, β1)
7
A B-SAT algoritmus egy
ϕ Boole-formula bemenet és ϕ valamely változóβ parciális hozzárendeléssé bovíthet és 0-át megoldás egy minden változót tartalmazó ϕ-t kielégíto o, egyébként. A parciális hozzárendeléseket ebben az esetben a {0, 1} ábécé fölötti, n-nél nem hívása a B-SAT(ϕ, λ), ahol hosszabb szavaknak tekintjük. Az algoritmus kezdo λ az üres hozzárendelés. Látható, hogy ha az elozetesen konstruált β parciális hozzárendelés ϕ valamely klózát hamissá teszi, akkor az már soha nem lesz kiegészítve egy ϕ-t kielégíto β
inak
részleges hozzárendelése mellett egy Boole-értéket ad vissza: 1-et, ha a
hozzárendeléssé, a rekurziós fa aktuális csúcs alatti részfáját levágjuk (lásd még a 4.3-1. gyakorlatot). becsléséhez az adott A B-SAT futási idejének felso szolegesen választott C j klózt vizsgálunk. A
ϕ
minden
β
ϕ formulából egy tet-
hozzárendelése és kitöltendo
most elsosorban ebbol a három C j -ben eloforduló változó igazságértékeket kell kapjon 3
értékül. A 0 vagy 1 sorozatok 2
=
az algoritmus biztosan kiválasztja 8 lehetoségéb ol
azt az egyet, amely C j -t hamissá teszi. A szóban forgó csúcs B-SAT(ϕ, β) rehalott részfához vezet, amit nyugodtan levághatunk. A ϕ for adódóan további halott részfák állnak elo, melyeket nem kell gyemula szerkezetébol adódik a B-SAT egy felso korlátjára legrosszabb esetben lembe venni, ebbol kurziós fájában tehát egy
3
O((2
4
− 1)n/3 ) = O(
√ 3
n
7 )
≈ O(1.9129n ), ami a
naiv
3-SAT algoritmus O(2n ) korlátját még
A félreértések elkerülése végett hangsúlyozni kell, hogy a rekurziós fa más, mint egy NTM kiszámítási fája. A
B-SAT algoritmus teljesen determinisztikusan muködik, egy rekurziós fa mélységi bejárásának meg csúcsai az algoritmus rekurzív hívásait reprezentálják, a gyökere az elso hívást, a feleloen. Egy ilyen fa belso csúcsa pontosan akkor gyeleveleknél pedig további hívások nélkül terminál az algoritmus. A rekurziós fa egy k hívás az algoritmus k után kiváltott számításán belül következik be, továbbá nincs olyan reke egy k csúcsnak, ha a k k
? hívás, ami k-n belül van és k? -on belül van.
141
4.3. Az ítéletlogika kielégíthetoség-problémája
mindig javítja valamelyest. A
3-SAT determinisztikus idobonyolultsága még lejjebb szorítható, például Monien és
korláttal rendelkezik. A Speckenmeyer oszd-meg-és-uralkodj algoritmusa O(1.618 ) felso n
korlát világrekordját determinisztikus felso
3-SAT-algoritmusra jelenleg egy O(1.481n ) kor-
látos, lokális keresésen alapuló megoldás tartja, melyet Dantsin és társai készítettek. Vannak más, nemdeterminisztikus megközelítések is. Ezek közül egyet mutatunk be, egy Schöning úgynevezett munkáiból meríto,
véletlen séta algoritmust.
4.3.2. 3-SAT valószín¶ségi id®bonyolultsága Egy véletlen séta egy (véletlen) bejárás adott struktúrán, például egy euklideszi térben, egy végtelen rácson vagy egy gráfon. Esetünkben a gráfok bejárása érdekes, azon belül is olyan gráfok bejárása, melyek egy meghatározott sztochasztikus automatát reprezentálnak. Egy sztochasztikus automata egy speciális véges automata. állapotgráfjának segítségével. A véges automata Egy véges automata szemléltetheto
Σ
állapotait csúcsok, az állapotok közti átmeneteket irányított, egy
ábécé szimbólumaival
címkézett élek jelölik. Egy csúcs a kitüntetett kezdoállapot szerepet kapja, ennél kezdodik az automata muködése, és akkor fejezodik be, ha a teljes bemenet feldolgozásra került. Az automata minden lépésben pontosan egy bemeneti szimbólumot olvas. Az állapotgráf bizonyos csúcsait végállapotként jelöljük meg, és amennyiben egy végállapotot érünk el a feldolgozás végén, akkor az automata elfogadja a bemenetet. Véges automatákkal szavakat ismerhetünk fel. Egy
Σ∗ -beli
=
w
w1 w2
· · · wn
szót az
automata pontosan akkor fogad el, ha a kezdoállapotból kiindulva w minden egyes wi szim sorrendben elolvassa, az állapotátmeneteket mindig a wi -vel jelölt él bólumát a megfelelo követésének megfeleloen hajtja végre, és végül elér egy végállapotot. Egy véges automata által elfogadott nyelv pontosan az ilyen módon elfogadott szavakból áll. Egy
S
sztochasztikus automata éleit utólagosan számokkal is felcímkézzük. Az
élhez rendelt pu,v (0 lapotgráfjában egy u-ból v-be vezeto színuségét adja meg, hogy
S
≤
≤
pu,v
S
ál-
1) érték annak való-
az u állapotból v állapotba lép. Egy sztochasztikus automata
(véletlen) állapotátmeneteinek folyamatát a sztochasztika tárgykörében Markov-láncoknak,
S sztochasztikus autoS által elfogadott nyelv
a végállapotokat pedig abszorpciós állapotoknak nevezhetjük. Egy mata esetében így természetesen egy w szó elfogadása (és ezzel az
deniálása) csak adott valószínuséggel következik be, mely valószínuséget a w feldolgozása ismerhetjük. során bejárt élek címkéibol Esetünkben azonban nem a nyelvfelismerés érdekes a sztochasztikus automata feladatai közül. Az automatát egy bejárásra szeretnénk alkalmazni, amit a R-SAT valószínu ségi algoritmus valósít meg. A R-SAT algoritmus megpróbál az n-változós
ϕ Boole-
behelyettesítést találni, amennyiben létezik ilyen. formulához egy kielégíto R-SAT valamely
ϕ bemenet mellett eloször is készít egy véletlenszeru β kezdeti β minden egyes bitje függetlenül választott egyenletes eloszlás mellett, tehát β minden bitje 0 vagy 1 értéket vesz fel 1/21/2 valószínuséggel. A behelyettesíté seket ismét mint {0, 1} feletti n-hosszú szavakat kezeljük. Tegyük fel, hogy ϕ kielégítheto, ϕ tetszolegesen behelyettesítése ϕ-be. Legyen X az a valóés legyen β választott kielégíto Hamming-távolságát fejezi ki, vagyis azon bitek számát, színuségi változó, ami a β és β nem egyeznek meg. X nyilvánvalóan a j ∈ {0, 1, . . . , n} értékeket veheti fel, valaahol β és β mint X = j valószínusége n binomiális eloszlású n és 1/2 paraméterekkel. Ennek megfeleloen hozzárendelést, ahol
−n
j
2
.
142
4. Bonyolultságelmélet
s 1
6
15
20
15
6
1
64
64
64
64
64
64
64
2
2
3
1
0
1
1
3
2
3
2 3
3
2 3
4
2 3
5
6
1
1
1
1
1
3
3
3
3
3
2 3
4.7. ábra. Egy R-SAT bejárás sztochasztikus automatájának állapotgráfja.
R-SAT(ϕ) 1
for i
← 1 to d(4/3)n e
2
do válasszunk egy
3
for j
4
B n a ϕ változóinak száma. β ∈ {0, 1}n behelyettesítést, egyenletes eloszlás szerint
← 1 to n ϕ ( β) = 1
do if
β
7
B β kielégíti ϕ-t. = (x ∨ y ∨ z) klózt, ahol C(β) = 0 válasszunk véletlenszeruen egy ` ∈ { x, y, z} literált,
8
állapítsuk meg
9
változtassuk meg
5
then return
6
else válasszunk egy C
egyenletes eloszlás szerint
10
return
β `-edik lefoglalt β` ∈ {0, 1} bitjét β-ban β` -t (1 − β` )-re
ϕ kielégíthetetlen
A R-SAT algoritmus ezután ellenorzi, hogy a kezdetben választott
β hozzárenϕ formulát, és amennyiben igen, akkor elfogadja a bemenetet. Egyébként pedig ha β nem teszi igazzá ϕ-t, akkor léteznie kell egy ϕ-beli klóznak, amit β nem elégít ki. A R-SAT tetszolegesen kiválaszt egy ilyen klózt, a kiválasztott klózban egyenletes eldelés kielégíti-e a
oszlás mellett véletlenszeruen kijelöl egy literált, és megcseréli az ehhez a literálhoz rendelt
β behelyettesítésben. Ezt n-szer megismétli, majd amennyiben az aktuális ϕ formulát, akkor a R-SAT újraindul egy n új kezdeti hozzárendeléssel és megismétli a teljes fent leírt próbát t-szer, ahol t = d(4/3) e. A 4.7. ábrán egy S sztochasztikus automata szerepel, melynek éleit nem szimbólumokkal, hanem mindössze átmenet-valószínuségekkel címkéztük. A R-SAT algoritmus ϕ bemenet melletti muködését a következokben mint S egy bejárását mutatjuk be. Az s kez doállapotból kiindulva amit késobb már sosem érintünk R-SAT(ϕ) az n és 1/2 paraméteru binomiális eloszlásnak megfeleloen lép tovább egy j ∈ {0, 1, . . . , n} állapotba. része egy n = 6 változós ϕ Boole-formula esetében. Egy ilyen j álEzt mutatja a kép felso kielégíto lapot azt jelenti, hogy a véletlenszeruen választott β kezdeti behelyettesítés és a β behelyettesítés állandó közötti Hamming-távolság j. Amíg j , 0, addig R-SAT(ϕ) a for ciklusban a kielégíto megoldást keresve mindig megváltoztatja az aktuális β bebelso helyettesítés egy β` bitjét (1 − β` )-re. Az S bejárásban ez megfelel egy lépésnek a j − 1 állapotba balra vagy a j + 1 állapotba jobbra, ahol csak n-nél kisebb vagy n-nel egyenlo bitet az aktuális
behelyettesítés még mindig nem elégíti ki a
el. állapot érheto behelyettesítés kielégíti Az állandóra választott β
ϕ-t, tehát ϕ minden klózából legalább által egy literált igazzá tesz. Ha minden klózban pontosan egyet kijelölünk ezek közül a β
143
4.3. Az ítéletlogika kielégíthetoség-problémája
` literált − 1-be) nyilvánva j + 1-be) valószínusége lóan mindig 1/3, a jobbra lépés ( j-bol pedig mindig 2/3. Hamming-távolsága 0 lesz. Ennek Bármikor is érjük el a j = 0 állapotot, ott β és β megfeleloen β kielégíti a ϕ formulát, és R-SAT(ϕ) visszaadja β aktuális értékét, majd -tól kümegáll elfogadó állapotban. Egy j , 0 állapotban természetesen belefuthatunk egy β
kielégített literálok közül, úgy pontosan akkor lépünk egy lépést balra, ha ezt az R-SAT(ϕ) kiválasztja. Egy balra lépés valószínusége (j
>
0-ból j
kielégíto behelyettesítésbe is, de mivel ez a lehetoség lönbözo az elfogadás valószínuségét csak növelheti, ezért az elfogadás valószínuségének becslésénél most gyelmen kívül hagyjuk. Ha a j
= 0 állapotot nem érjük el β behelyettesítés n-szeri bitcseréjével, akkor a kezdo
behelyettesítést olyan rosszul választottuk, hogy R-SAT(ϕ) egyszeruen eldobja, és egy új kezdeti értékkel próbál ismét szerencsét. 0 végállapottól jobbra távoMivel annak valószínusége, hogy a (számunkra kedvezo) lodjunk nagyobb, mint annak valószínusége, hogy 0 irányába balra haladjunk, azt gondolhatjuk, hogy R-SAT nem túl nagy valószínuséggel jár sikerrel. Annak esélyét sem rögtön a nulladik lépés után a 0 közelébe kerülünk. szabad azonban alábecsülni, hogy s-bol pozíciónk, annál nagyobb annak valószínusége, Minél közelebbi a 0-hoz a kezdo hogy a véletlen jobbra- vagy balra-lépések lefutásával 0-ba ütközünk. rákövetkezo R-SAT eredményességének valószínuségére és az algoritmus futási idejére vonatkozó elemzést itt most nem mutatjuk be teljes részletességében, csak vázlatszeruen. Az egyszeruség kedvéért tegyük fel, hogy n a 3 egész értéku többszöröse. Legyen pi annak valószínusége, hogy R-SAT n lépésen belül eléri a 0 állapotot, azzal a feltétellel, hogy R-SAT a bejárás nulladik lépésében (β kezdeti véletlen hozzárendelés megválasztásakor) az i
≤ n/3
állapotba kerül. Amennyiben például kezdetben az n/3 állapotba
kerülünk, akkor legfeljebb n/3 lépés megengedett a
rossz irányba jobbra, ami kiegyen el helyes irányba, balra tett lépésekkel. Egyéb esetekben a 0 állapot nem érheto n lépésben. Általában az i állapotból kiindulva legfeljebb (n − i)/2 lépést tehetünk jobbra,
a lítheto
a következo becslés adódik pi -re: amibol
pi
=
n n−i 2
!
2
!(n−i)/2
3
1
!n−(n−i)/2
3
.
(4.2)
Legyen továbbá qi annak valószínusége, hogy R-SAT a bejárás nulladik lépésében az i
≤ n/3 állapotba jut. Ekkor természetesen fennáll ! n qi = · 2−n .
(4.3)
i
Végül pedig legyen p az eredményesség valószínusége, amikor R-SAT a külso for ciklus egy körében eléri a 0 állapotot. Ez lehetséges j
> n/3 állapotokból is. Ennélfogva
fennáll
p
≥
n/3 X
pi
· qi .
i=0
az entrópiafüggvény segítségével, továbbá az összeg tagjaiban Ez az összeg közelítheto a Stirling-formulával, így végül (4.2) és (4.3) binomiális együtthatói közelíthetok
Ω((3/4)n )
adódik p alsó korlátjának. A hibás futás elkerülése érdekében a R-SAT algoritmus összesen t független kí sérletet hajt végre, melyek mindegyike új kezdoértékkel indul, és legalább a fent megadott
144
4. Bonyolultságelmélet
(3/4) hozzávetoleges
n
valószínuséggel sikerrel jár. Mivel a kísérletek függetlensége miatt
ezek a valószínuségi értékek szorzódnak, ezért R-SAT eredményes futásának valószínusége tehát annak valószínusége, hogy R-SAT megadja
ϕ
beheegy kielégíto
lyettesítését, amennyiben az létezik nagyon közel van 1-hez. Ha pedig
ϕ kielégíthetetlen, ϕ kielé-
R-SAT sosem követ el hibát, tehát ezekben az esetekben a kimenet mindig gíthetetlen lesz. Az algoritmus futási ideje megegyezik az eredményes futás p
≈
(3/4)
n
valószínuségé
nek reciprokával, mivel egy hiba valószínusége (amikor a t próba során egyszer sem találunk t −t · p (1 − p) ≤ e Amennyiben ϕ kielégítheto) -vel becsülheto. t értékét tehát nem szeretnénk egy elore adott ε hibavalószínuségi értéket átlépni, elegendo −t· p ol úgy megválasztani, hogy e ≤ ε illetve t ≥ ln(1/ε)/ p fennálljon. A konstans tényezokt n n az algoritmus futási ideje tehát O ((4/3) ). eltekintve ez t = d(4/3) e választásával elérheto,
behelyettesítést, pedig kielégíto
Gyakorlatok
4.3-1. Indítsuk el a B-SAT algoritmust
ϕ = (¬ x ∨ y ∨ ¬z) ∧ (x ∨ ¬y ∨ z) ∧ (¬u ∨ ϕ egy kielégíto
lépésre y ∨ z) ∧ (u ∨ ¬y ∨ z) Boole-formulával, és konstruáljuk meg lépésrol
behelyettesítését. Rajzoljuk fel az így kialakuló rekurziós fát, és határozzuk meg a fa azon részeit, melyeket levágunk, mert nem vezethetnek megoldáshoz.
4.4. Gráfizomorfizmus és alsóság alfejezetben szükségünk lesz a 3.1.3. alfejezetben leírt csoport- és gráfelméA következo leti alapokra. Különösen fontos felidézni a 3.6. deníció permutációcsoport fogalmát, a grázomorzmus problémát, valamint a 3.8. deníció
GA
GI
gráfautomorzmus problémáját
(lásd még a 3.4. példát is).
4.4.1. Visszavezethet®ségek és bonyolultsági hierarchiák A 4.2. pontban megismerkedtünk a hatékonyan megoldható házasítás problémával, valamint az NP-teljes
SAT, 3-SAT és 3-DM problémákkal. Könnyen meggondolhatjuk, hogy P =
NP
pontosan akkor teljesül, ha minden NP-beli probléma beleértve az NP-teljes problémákat is P-ben helyezkedik el. Amennyiben P
, NP, akkor P-ben nem lehetnek NP-teljes prob, NP
P lémák. Megoldható-e vajon hatékonyan minden NP-beli probléma a hihetonek tun o
feltevés mellett, tehát P-beliek-e, vagy pedig NP-teljesek? Tudunk-e vajon olyan NP-beli problémákat adni P
,
NP feltevés mellett, melyek nem oldhatók meg hatékonyan, de nem
tétel adja meg. is NP-teljesek? A választ a következo 4.11. tétel (Ladner). Ha P
,
NP, akkor léteznek olyan problémák NP-ben, melyek se nem
P-beliek, se nem NP-teljesek. A Ladner által megadott problémák valamelyest mesterségesek olyan szempontból, hogy közvetlenül a 4.11. tétel bizonyításához készültek. Vannak azonban olyan természe jelöltek arra, hogy se P-beliek, se pedig NPtes problémák is NP-ben, melyek megfelelo teljesek ne legyenek. Ezek közül egy
GI,
a grázomorzmus probléma, és ezt szeretnénk
most bizonyítani. Ehhez deniálunk NP-n belül két, Schöning által bevezetett bonyolultsági osztályhierarchiát, az úgynevezett alsó-, valamint a felso-hierarchiát. Ahhoz, hogy
145
4.4. Grázomorzmus és alsóság
polinomiális idoezt a két hierarchiát deniálni tudjuk, be kell vezetnünk az NP-re épülo hierarchia fogalmát, ennek deníciójához pedig szükségünk van egy, a 4.5. denícióban bevezetett sok-egy visszavezethetoségnél általánosabb visszavezethetoségre, nevezetesen a p
≤T fogalmára. Deniáljuk továbbá a nemdeterminisztikus és az NP NP fogalmakat, melyek a és ≤ erosen nemdeterminisztikus Turing-visszavezethetoség ≤ sT T
Turing-visszavezethetoség, a
polinomiális ido-hierarchia esetében fontosak. Ezek a visszavezethetoségek az orákulumos Turing-gép fogalmára építkeznek. Most tehát deniáljuk a nevezett fogalmakat. 4.12. deníció (orákulumos Turing-gép). Az orákulum-halmaz (röviden orákulum) szavak egy halmaza. Egy B orákulummal rendelkezo orákulumos M Turing-gép egy olyan Turing-gép, ami rendelkezik egy speciális
kérdés-szalaggal, állapotainak halmaza pedig
tartalmaz egy speciális z? kérdés-állapotot, valamint zyes és zno válasz-állapotokat. Amíg M nincs a z? állapotban, addig pontosan úgy viselkedik, mint egy szokványos Turing-gép. Ha azonban muködése során z? kérdés-állapotba kerül, akkor megszakítja futását, és kérdést intéz az orákulumhoz az éppen a kérdés-szalagon álló q szóról. Az orákulumot egyfajta fekete dobozként képzelhetjük el: B orákulum egy lépésben eldönti, hogy q szó B-beli-e, függetlenül attól, hogy ennek eldöntése milyen nehézségu feladat. Ha q ∈ B, akkor M a következo lépésben zyes válasz-állapotba kerül és folytatja muködését. Ellenkezo esetben (ha q
<
B) M zno állapotban folytatja muködését. Ekkor azt mondjuk, hogy az M Turing-géppel B
x bemenet kiszámítása relatív B orákulumra nézve, a kiszámítást pedig M (x)-el jelölünk. B
Legyen L(M ) az M
B
által elfogadott nyelv. Egy
C bonyolultsági osztályt relativizálhatónak
nevezünk, ha reprezentálható orákulumos Turing-gépekkel (üres orákulum-halmaz mellett) az eloz oeknek megfeleloen. Deniáljuk egy orákulum mellett a B-re relatív
C
C relativizálható bonyolultság-osztály és egy
B
osztályt a következoképp:
CB = {L(M B ) | M egy C-t reprezentáló orákulumos Turing-gép} . S B B Ha B halmazok egy osztálya, akkor legyen C = B∈B C . NPOTM (illetve DPOTM) jelöli a nemdeterminisztikus (illetve a determinisztikus) po osztályok: linomiális ideju orákulumos Turing-gépeket. Deniálhatók például a következo NP
NP
=
P
NP
=
[ NP
B
= {L(M B ) | M egy NPOTM, B pedig NP-beli} ;
B∈NP
[
P
B
= {L(M B ) | M egy DPOTM, B pedig NP-beli} .
B∈NP
Amennyiben az orákulum üres halmaz (∅), akkor a nem relativizálható NP P
=
P
∅
=
NP
∅
illetve
beszélhetünk, DPOTM heosztályokhoz jutunk. NPOTM helyett ekkor NPTM-rol
Különösen jól alkalmazhatók az orákulumos Turing-gépek keresési lyett pedig DPTM-rol. példa mutatja. Az itt alfeladatokhoz, mint amilyen a prexkeresés is, ahogy a következo kalmazott Pre-Iso NP-orákulum szolgáltatja azt az információt, hogy hogyan lehet az üres bitre haladva az NP-beli szóból kiindulva bitrol
GI probléma legkisebb megoldását eloállí-
tani, amennyiben létezik ilyen megoldás. 4.5. példa. Prexkeresés a legkisebb izomorzmus után orákulumos Turing-géppel. A
GI
grázomorzmus problémát az 3.1.3. alfejezet 3.8. deníciójában fogalmaztuk meg. Le-
gyenek G és H két adott gráf n
≥ 1 darab csúccsal. A G és H
közti izomorzmusokat
(G , H)
∈ GI
146
4. Bonyolultságelmélet
megoldásának
nevezzük. Az Iso(G , H) izomorzmus-csoport tartalmazza a
megoldását, valamint Iso(G , H)
, ∅ ⇐⇒
legkisebb megoldás eloállítása a célunk, vel tudatnunk kell, hogy függvényt:
(G , H)
< GI. (
f (G , H)
=
(G , H) ∈ GI összes ∈ GI. Ha (G, H) ∈ GI, akkor egy lexikograkusan esetben pedig az üres λ szó kimenet segítségéellenkezo (G , H)
Tehát, ki szeretnénk számítani a következoképp deniált f
π ∈ Iso(G, H)},
min{π
ha (G , H)
λ,
ha (G , H)
Sn deníciója a kö= {1, 2, . . . , n} ábécé fölötti π(1)π(2) · · · π(n) szót. Pontosan akkor írható π < σ (π, σ ∈ Sn ), ha létezik egy olyan j ∈ [n], melyre minden i < j esetén π(i) = σ(i), valamint π( j) < σ( j). Amennyiben egy σ ∈ Sn permutációból kitörlünk néhány (i, σ(i)) párt, akkor parciális permutációt kapunk, amit szintén kezelhetünk [n] fölötti szóként. A σ ∈ Sn egy k ≤ n hosszú prexe σ egy olyan parciális permutációja, amely minden (i, σ(i)) párt tartalmaz i ≤ k mellett, viszont egyetlen (i, σ(i)) párt sem i > k esetén. A k = 0 esetben σ prexe a λ üres szó, valamint k = n esetben a teljes permutáció. Ha π a σ ∈ Sn egy k < n hosszú prexe és w = i1 i2 · · · i|w| egy [n] fölötti |w| ≤ n − k hosszú szó, akkor jelölje πw azt a parciális permutációt, ami π-t a (k + 1, i1 ), (k + 2, i2 ), . . . , (k + |w|, i|w| ) párokra bovíti. Ha 1 ≤ j ≤ |w| esetén σ(k + j) = i j , akkor πw is σ egy prexe. Deniáljuk G és H gráfok mellett az Iso(G, H)-beli izomorzmusok prexeinek
ahol a lexikograkus rendezésre vonatkozó minimumot
π ∈ Sn
kezeljük a vetkezo:
Sn -bol
∈ GI , < GI ,
képezzük. A
egy permutációját mint n hosszú, [n]
halmazát:
{(G, H, π) (∃w ∈ {1, 2, . . . , n}∗ ) [w = i1 i2 · · · in−|π|
=
Pre-Iso
és
πw ∈ Iso(G, H)]} .
≥ 1-re a λ üres szót egy permutáció sem képzi le Sn -be, valamint hogy = ∅ pontosan akkor áll fenn, ha (G, H, λ) < Pre-Iso, ami viszont akkor és csak akkor igaz, ha (G , H) < GI. Figyeljük meg, hogy n Iso(G , H)
N-P-I(G , H) if (G , H, λ)
1
< Pre-Iso
2
then return 0
3
else
4
π←λ j ← 0
5
while j
6
m. Egy h : Σt → Σm hasító függvény lineáris leképezés, ami egy (t × m) Boole-mátrixszal t adott, mégpedig Bh = (bi, j )i, j -vel, ahol bi, j ∈ {0, 1}. Minden x ∈ Σ és 1 ≤ j ≤ m mellett az m y = h(x) ∈ Σ j-edik bitje mint y j = (b1, j ∧ x1 ) ⊕ (b2, j ∧ x2 ) ⊕ · · · ⊕ (bt, j ∧ xt ) adódik, ahol ⊕ a logikai paritásmuveletet jelenti, tehát a1 ⊕ a2 ⊕ · · · ⊕ an = 1 ⇐⇒ |{i | ai = 1}| ≡ 1 mod 2. t m Legyen Ht,m = {h : Σ → Σ | Bh egy (t × m) Boole-mátrix} hasító függvények egy családja, t és m paraméterekkel. A Ht,m -re egyenletes eloszlást tételezünk fel: Ht,m -bol egy 4.19. deníció (hasítás). t
h hasító függvényt emelünk ki, amelynél a Bh -beli bi, j -ket függetlenül és egyenletes eloszlás mellett választjuk. Legyen V
⊆ Σt . A Ht,m (∃v
Egyéb esetekben
egy
b részcsaládjára akkor lép fel ütközés V -n, ha H
b) (∃ x ∈ V ) [v , x ∧ h(v) = h(x)] . ∈ V ) (∀h ∈ H
b a V -n ütközésmentes. H
Egy V fölötti ütközés azt jelenti tehát, hogy megsérül egy tetszolegesen választott
b H
lemma kimondja, hogy minden családbeli hasító függvény injektivitása V -n. A következo kelloen kis V halmazon
Ht,m
egy véletlenszeruen választott részcsaládja ütközésmentes, ha
pedig V túl nagy, az ütközés elkerülhetetlen. A 4.20. lemma bizonyításától eltekintünk. 4.20. lemma (hasítás lemma).
Legyenek t, m
∈ N
paraméterek, V
⊆ Σt
és
b = H
(h1 , h2 , . . . , hm+1 ) egy egyenletes eloszlás mellett véletlenül választott hasító függvény család
Ht,m -bol. Legyen K(V )
b | (∃v ∈ V ) (∀h ∈ H b) (∃ x ∈ V ) [v , x ∧ h(v) = h(x)]} = {H
b-ban egy ütközés fellépésének eseménye V -n. Ekkor H 1.
ha |V |
≤ 2m−1 , akkor K(V ) legfeljebb 1/4 valószínuséggel következik be,
2.
ha |V |
> (m + 1)2m , akkor K(V ) 1 valószínuséggel következik be.
A 3.5. alfejezetben deniáltuk az Artúr-Merlin hierarchiát és említettük, hogy ez a hierarchia a második szintjére omlik össze. Számunkra most a coAM osztály érdekes, lásd a 3.16. deníciót.
152
4. Bonyolultságelmélet
GI probléma Low2 -beli.
4.21. tétel (Schöning). A
Bizonyítás. A 4.18. tétel alapján minden coAM-beli NP-halmaz Low2 -beli. beliségének belátásához elégséges tehát azt megmutatni, hogy
GI
GI
Low2 -
coAM-beli. Legyenek
gráfok. A hasítás lemmát szeretnénk alkalmazni. Ígéretesnek G és H n csúccsal rendelkezo tunik, hogy a 3.11. lemmában deniált A(G , H)
= {(F, ϕ) | F G és ϕ ∈ Aut(F)} ∪ {(F, ϕ) | F
H és
ϕ ∈ Aut(F)}
halmaz a 4.20. lemma V -jének szerepét vegye fel. A 3.11 lemma szerint | A(G , H)| amennyiben G
H és | A(G , H)|
= 2n!, ha G
H. Ahhoz, hogy a
= n! GI-t megoldó coAM-gép
polinomiális idoben dolgozzon, a hasítás lemma t és m paraméterei n-ed fokú polinomok kell legyenek. A lemma alkalmazásához az m hogy n! fennálljon, mivel ekkor lesz a V
= m(n) polinomot úgy kellene választanunk,
≤ 2m−1 < (m + 1)2m < 2n!
=
(4.4)
A(G , H) halmaz elég nagy ahhoz, hogy elegendoen nagy
valószínuséggel meg tudjunk különböztetni két izomorf G és H gráfot két nem izomorf gráf tól. Sajnos nem létezik olyan m polinom, hogy a (4.4) egyenlotlenség fennálljon, ehelyett és alsó korlátok közötti rést elég naggyá választunk egy másik V halmazt, amivel a felso tudjuk tenni. Legyen V
=
A(G , H)
n
=
A(G , H)
|
× A(G, H) × · · · × A(G, H). Ezzel (4.4) a következo{z } n-szer
képp alakul: n
(n!)
≤ 2m−1 < (m + 1)2m < (2n!)n ,
(4.5)
= m(n) = 1 + dn log n!e választással. GI-hez a következoképp. Az n csúcsú G és H gráfok n kiszámítja az m paramétert. A V = A(G , H) halmaz bemenete mellett M mindenekelott n darab (F, ϕ) formájú párost tartalmaz, ahol F egy n csúcsú gráf és ϕ ∈ Aut(F). Tekintsük a V elemeit mint t(n) hosszú, Σ = {0, 1} ábécé fölötti szavakat, ahol t egy alkalma az m ahol az új egyenlotlenség kielégítheto Készítsünk egy M coAM-gépet
san választott polinom. Ekkor M egyenletes eloszlás mellett véletlenszeruen választ egy
b = H
(h1 , h2 , . . . , hm+1 ) hasító függvény családot
Ht,m -bol,
ami megfelel Artúr lépésének.
b hasító függvényt egy (t × m) Boole-mátrixszal reprezentálunk, ezért az ∈ H ∗ b m + 1 darab, H -beli hi hasító függvény ábrázolható mint p(n) hosszú z b ∈ Σ szó, ahol p
Minden hi
H
egy alkalmas polinom. Módosítva a hasítás lemma K(V ) ütközés predikátumát B
= {(G, H, zHb ) | (∃v ∈ V ) (∀i : 1 ≤ i ≤ m + 1) (∃ x ∈ V ) [v , x ∧ hi (v) = hi (x)]} .
A B-ben elforduló
∀ kvantor csak
polinomiálisan sok i-t határoz meg, ezért determiniszti-
valamint B mindkét kus módon polinomiális idoben kiértékelheto, egy darab polinomiális hosszra korlátozott
Σ1p =
∃
∃ kvantora összefogható
kvantorrá. A 4.16. tétel alapján tehát B egy
szóhoz amit m NP-beli halmaz. Legyen N egy NPTM B-hez. A z b készülo
H
+1
függetlenül és egyenletes eloszlás mellett választott hasító függvény reprezentál M szimulálja az N(G , H, z b ) kiszámítását, ami megfelel Merlin lépésének. Az M pontosan akkor
H
fogadja el a (G , H) bemenetét, ha N(G , H, z b ) elfogad.
H
Becsüljük meg (a z b -ban kódolt hasító függvény véletlenszeru választása mellett) anH nak valószínuségét, hogy M elfogadja (G , H) bemenetét. Ha G és H izomorfak, akkor a 3.11
153
4.4. Grázomorzmus és alsóság
lemma alapján | A(G , H)|
=
|V | n!. A (4.5) egyenlotlenségb ol
=
(n!)
n
≤
m−1
2
következik. A
4.20. lemma alapján annak valószínusége, hogy (G , H, z b ) B-beli, következésképp M(G , H)
H
elfogad, legfeljebb 1/4. Ha ezzel szemben G és H nem izomorfak, akkor a 3.11. lemma szerint | A(G , H)|
=
2n!, a
pedig |V | (4.5) egyenlotlenségb ol
=
n
(2n!)
>
(m
+ 1)2m
adódik.
A 4.20. lemma alapján ekkor annak valószínusége, hogy (G , H, z b ) B-beli, tehát M(G , H)
H
következik tehát, hogy elfogad, közel 1. Ebbol
GI coAM-beli.
4.4.3. A gráfizomorfizmus SPP-beli A 3.3.1. alfejezet 3.14. deníciójában bevezettük az RP valószínuségi osztályt. A követ alfejezetben két további, itt deniált valószínuségi kezo osztály játszik szerepet: pp és SPP, melyek a Probabilistic Polynomialtime és a Stoic Probabilistic Polynomialtime angol kifejezések rövidítései. 4.22. deníció (PP és SPP). A pp osztály azokat az A problémákat foglalja magában, melyekhez létezik egy M NPTM úgy, hogy minden x bemenetre: ha x nem kisebb valószínuség mellett elfogad, és ha x
<
∈
A, akkor M(x) 1/2-nél
A, akkor M(x) valamely 1/2-nél kisebb
valószínuséggel fogad el. Jelölje acc M (x) az M(x) elfogadó útjainak számát egy M NPTM-nél x bemenet mellett, valamint rej M (x) az M(x) visszautasító útjainak számát. Legyen továbbá gap M (x) acc M (x)
=
− rej M (x).
Az SPP osztály azokból az A problémákból áll, melyekre létezik olyan M NPTM, hogy minden x-re (x
∈
A
=⇒
gap M (x)
= 1) és (x <
A
=⇒
gap M (x)
= 0) teljesül.
Egy SPP-gép sztoikus tehát abban az értelemben, hogy a rése tehát az elfogadó és a visszautasító utak különbsége mindig csak két értéket vesz fel az exponenciális számú lehetséges érték közül. A pp-vel ellentétben az SPP így egy úgynevezett ígéret osztály ( promise class), mivel egy M SPP-gép azt ígéri, hogy minden x-re gap M (x) teljesül (lásd még a 4.4-4. gyakorlatot).
∈ {0, 1}
C bonyolultsági osztályra deniálhatC-alsó, ha CA = C teljesül. Speciálisan minden k-ra
Az alsóság fogalmát tetszoleges relativizálható juk: egy A halmaz akkor és csak akkor
a 4.17. deníció alsóság-hierarchiájának Lowk szintje pontosan azokból az NP-halmazokból áll, melyek
Σkp -alsó tulajdonságúak. Minden, a fent deniált SPP osztályba tartozó halmaz
tételben ezek mellett bizonyítás nélkül összefoglalunk néhány hasonló pp-alsó. A következo tulajdonságot. 4.23. tétel. SPP
1.
Az SPP osztály pp-alsó, tehát pp
2.
Az SPP önmagával alsó (angolul
3.
Legyen A
∈
= pp.
self-low), tehát SPP = SPP. A NP egy N NPTM-el egyeztetve és L ∈ SPP egy M NPOTM-mal egyeztetve SPP
úgy, hogy az M-A(x) minden x bemenetre csak olyan q kérdést tesz fel, melyre accN (q)
≤
1 fennáll. Ekkor L SPP-beli. 4.
Legyen A
∈
NP egy N NPTM-mel egyeztetve és f
∈
FP
A
egy M DPOTM-ma egyez-
tetve úgy, hogy M-A(x) minden x bemenet mellett csak olyan q kérdést tesz fel, melyre accN (q)
≤ 1. Ekkor
f FP
SPP
-beli.
154
4. Bonyolultságelmélet
tétel kimondja, hogy egy jobb oldali co-halmaz lexikograkusan legkisebb A következo permutációja hatékonyan kiszámítható. A
Sn
lexikograkus rendezését a 4.5. példában de-
niáljuk. 4.24. tétel. Legyen
G ≤ Sn
egy permutációcsoport
G = hGi mellett és π ∈ Sn
egy permu-
táció. Ekkor létezik olyan algoritmus, amely a (G , π) bemenetre polinomiális idoben meghatározza a
Sn -beli G jobb oldali co-halmazát, Gπ-t.
Bizonyítás. A LERC algoritmus a lexikograkusan legkisebb permutáció kiszámítását végzi a
Sn -beli G
jobb oldali co-halmazában
Gπ-ben,
ahol a
G
permutációcsoport egy G
generátorfüggvényen keresztül adott, lásd a 3.1.3. pont 3.6. denícióját. A 3.7. tétel segítségével polinomiális idoben számítható az id
G
= G(n) ≤ G(n−1) ≤ · · · ≤
≤ G = G, G stabilizátor lánc. Pontosabban fogalmazva minden egyes i-re meghatá képezzük G egy G(i) jobb oldali T i reprezentáns rendszerét, ahol 1 ≤ i ≤ n, és ebbol Sn−1 (n−1) (n) T generátorát. Mivel ϕ = π és G = G = id, ezért a bizonyításerosebb S = i 0 i=1 hoz elég a LERC algoritmus helyességét megmutatni, tehát azt, hogy 0 ≤ i ≤ n − 1 esetén (i+1) minden i-re a G ϕi+1 -beli G(i) ϕi legkisebb permutációját kapjuk. (1)
(0)
rozzuk
LERC(G , π) 1 2 3 4 5 6 7 8
G-beli stabilizátorok G(n) ≤ G(n−1) ≤ · · · ≤ G(1) ≤ G(0) láncát ϕ0 ← π for i ← 0 to n − 1 do x ← i + 1 (i) számítsuk ki a G (x) pályán az y elemet, melyre ϕi (y) minimális (i) határozzunk meg egy τi permutációt G -ben τi (x) = y mellett ϕi+1 ← τi ϕi return ϕn
számítsuk ki a
indukcióval következik, hogy Ebbol
G(n) ϕn = {ϕn }
a
Gπ = G(0) ϕ0
lexikograkusan legki-
sebb permutációja. Következésképp tehát a LERC algoritmus valóban legkisebb
Gπ lexikograkusan
ϕn permutációját adja vissza.
H ≤ Sn permutációcsoportbeli x ∈ [n] eleG(i) -beli permutáció, amely a i + 1-et a G(i) (i + 1) (i) y-ra képzi le, és amelyre ϕi (y) = x a {ϕi (z) | z ∈ G (i + 1)} halmaz minimális pályában lévo (i) eleme. A 3.7. tétel alapján a G (i + 1) pálya polinomiális idoben kiszámítható, és mivel G(i) (i + 1) legfeljebb n − i elemet tartalmaz, ezért y hatékonyan meghatározható. Az algorit(i) mus deníciója alapján fennáll ϕi+1 = τi ϕi . Mivel G minden permutációja minden [i]-beli (i) elemet önmagára képez le és mivel τi ∈ G , ezért minden j-re, amelyre 1 ≤ j ≤ i, minden τ ∈ G(i) -re és minden σ ∈ G(i+1) -re: A fenti állítás bizonyításához jelöljük egy
mek pályáját
H(x)-el.
Legyen
(σϕi+1 )( j)
τi
az a
= ϕi+1 ( j) = (τi ϕi )( j) = ϕi ( j) = (τϕi )( j).
speciálisan következik, hogy minden Ebbol mutációra fennáll, hogy minden
G
(i+1)
G(i) ϕi -beli µ
lexikograkusan legkisebb per-
ϕi+1 -beli permutációnak egyeznie kell µ-vel az elso i
155
4.4. Grázomorzmus és alsóság
elemre. Ezen kívül minden
σ ∈ G(i+1) -re és a fent deniált
(σϕi+1 )(i
x
= ϕi (y) elemre fennáll
+ 1) = ϕi+1 (i + 1) = (τi ϕi )(i + 1) = x.
G(i+1) ϕi+1 = {ϕ ∈ G(i) ϕi | ϕ(i + 1) = x}. Az állítás ezután abból a ténybol (i) következik, hogy a G ϕi -beli lexikograkusan legkisebb µ permutációra fennáll µ(i + 1) = Természetesen x.
Ezzel megmutattuk, hogy a LERC algoritmus hatékonyan és helyesen muködik.
a 4.25. következménnyé (lásd a 4-3.. feladatot). Ehhez A 4.24. tétel könnyen kibovíthet o tételét, a 4.26. tételt. kapcsolódóan bebizonyítjuk az alfejezet fo
G ≤ Sn egy permutációcsoport ahol G = hGi, valamint leπ és ψ két permutáció Sn -ben. Ekkor létezik olyan algoritmus, amely (G, π, ψ) bemenet mellett polinomiális idoben meghatározza ψGπ lexikograkusan legkisebb permutációját.
4.25. következmény. Legyen gyen
4.26. tétel (Arvind és Kurur). A Bizonyítás. Az
AUTO
GI probléma SPP-beli.
probléma a következoképp deniált: számítsuk ki egy adott G gráf-
hoz az Aut(G) automorzmus-csoportot (a fogalmak értelmezéséhez lásd a 3.6 deníciót és bekezdést, valamint a 3.8 deníciót). Mathon eredményei alapján alapján az az azt követo
AUTO és a GI problémák Turing-ekvivalensek, tehát AUTO ∈ FPGI és GI ∈ PAUTO , ezért elég AUTO FPSPP -beliségét megmutatni. Ezután SPP 4.23. tételbeli önmagával alsó ( self-low) AUTO tulajdonságából következik, hogy GI P ⊆ SPPSPP ⊆ SPP-beli, amivel a tételt be is láttuk. SPP Célunk tehát, hogy találjunk AUTO-hoz egy FP -algoritmust. Ennek az algoritmusnak Sn−1 egy adott G gráf esetén egy S = T er os generátort kell kiszámítania Aut(G)-hez, ahol i i=1 id
= Aut(G)(n) ≤ Aut(G)(n−1) ≤ · · · ≤ Aut(G)(1) ≤ Aut(G)(0) = Aut(G)
az Aut(G) stabilizátorainak lánca, T i (1 reprezentáns rendszere Aut(G)
(i−1)
≤
i
≤
-ben. A triviális Aut(G) (i)
generátort Aut(G) lépésre építünk fel egy eros generátort Aut(G) egy eros
Sn−1 j=i
FP
(0)
=
(0)
-algoritmus Aut(G)
(i)
(n)
=
(i)
egy teljes jobb oldali
id esettel kezdve lépésrol
i mellett, végül tehát kapunk -hez, csökkeno
Aut(G)-hez. Tegyük fel tehát, hogy már találtunk egy S i
generátort Aut(G) T j eros
SPP
n) pedig Aut(G)
=
=
Aut(G)-hez. Most leírjuk hogyan határozza meg az
egy teljes jobb oldali reprezentáns rendszerét Aut(G)
(i−1)
-ben,
T i−1 -et. Ehhez deniáljuk az
A = (G , S , i, j, π)
⊆ Aut(G) és hS i egy pontonkénti stabilizátora [i]-nek Aut(G)-ben, π egy pontonként [i − 1] által stabilizált parciális permutáció és π(i) = j, valamint létezik egy τ ∈ Aut(G)(i−1) , ahol τ(i) = j és LERC(S , τ) a π bovítése S
halmazt. A 4.24. tétel alapján a hS iτ jobb oldali co-halmazhoz tartozó LERC(S , τ) lexiko grakusan legkisebb permutáció polinomiális idoben kiszámítható a LERC algoritmus se-
π parciális permutáció a (G, S , i, j, π) bemenet része, mivel az A halmazt mint τ ∈ Aut(G)(i−1) , τ(i) = j melletti permutáció prexkereséses meghatározásakor (vessük ezt össze a 4.5. példa N-P-I
gítségével. A
orákulumot szeretnénk használni a lexikograkusan legkisebb
156
4. Bonyolultságelmélet
algoritmusával). hogy ha Az N algoritmus egy NPTM A orákulumhoz, tehát A NP-beli. Eldöntendo,
τ(i) =
j, akkor fennáll-e hS iτ jobb oldali co-halmaz minden
σ permutációjára σ(i) =
j.
N(G , S , i, j, π)
⊆ Aut(G)(i)
1
ellenorizzük, hogy S
2
találjunk ki nemdeterminisztikusan egy
3
if
τ ∈ Aut(G)(i−1)
és
τ(i) =
j és
4
then elfogadás és megállás
5
else elutasítás és megállás
τ ∈ Sn permutációt B G n csúcsú. τ a π bovítése és τ = LERC(S , τ)
Most megmutatjuk, hogy N elfogadó útjainak száma (G , S , i, j, π) bemenet mellett vagy 0 vagy 1, amennyiben hS i
= Aut(G)(i) , valamint általában fennáll
accN (G , S , i, j, π)
∈
n
0, |Aut(G)
(i)
o |/|hS i| .
Eloször egy pszeudokódot adunk meg. M-A(G) 1 2 3 4 5 6 7 8 9 10 11 12
← {} minden i-re, ahol 0 ≤ i ≤ n − 2 B G n csúcsú. B T i az Aut(G)(i+1) egy teljes jobb oldali reprezentáns rendszere lesz Aut(G)(i) -ben. S i ← ∅ minden i-re, ahol 0 ≤ i ≤ n − 2 (i) generátor lesz Aut(G) -hez. S n−1 ← {id} B S i egy eros for i ← n − 1 downto 1 do B Az i-edik iteráció kezdetén S i -t már megtaláltuk, most S i−1 -et számítjuk ki. legyen π : [i − 1] → [n] parciális permutáció π(a) = a-val minden a ∈ [i − 1]-re B i = 1 esetén π a deniálatlan parciális permutáció. for j ← i + 1 to n do π ← πj B Tehát π bovíti π-t az (i, j) párral π (i) = j mellett. if (G , S i , i, j, π ) ∈ A (i−1) then B A prexkeresés eloállítja a legkisebb Aut(G) -beli, Ti
j-re képezo permutációt. i-rol 13
for k
14
← i + 1 to n
do keressük meg az (G , S i , i, j, π` )
16 17
B T i−1
most az Aut(G)
rendszere Aut(G) 19 20
` elemet, π leképezésein kívül, A mellett
π ← π` B π most egy teljes Sn -beli permutáció. T i−1 ← T i−1 ∪ π
15
18
∈
S i− 1 return S 0
(i)
(i−1)
egy teljes jobb oldali reprezentáns -ben.
← S i ∪ T i−1 (0) generátor Aut(G) = Aut(G) -hoz. B S 0 egy eros
157
4.4. Grázomorzmus és alsóság
Tegyük fel, hogy (G , S , i, j, π) A-beli. Ha
τ(i) =
j egy
τ∈
Aut(G)
akkor az hS iτ jobb oldali co-halmaz pontosan azokból az Aut(G)
(i−1)
(i−1)
mellett és j
>
i,
-beli permutációkból
áll, melyek i-t j-re képezik le. Következésképp N(G , S , i, j, π) egyetlen elfogadó útja megfelel az egyértelmuen meghatározott lexikograkusan legkisebb nak. Ha viszont hS i az Aut(G)
(i)
τ = LERC(S , τ) permutáció(i) τ ábrázolható az hS i
egy valódi alcsoportja, akkor Aut(G)
= |Aut(G)(i) |/|hS i| darab diszjunkt jobb oldali co-halmazának egyesítéseként. Általában tehát N(G , S , i, j, π) akkor rendelkezik k elfogadó úttal, ha (G , S , i, j, π) A-beli, egyébként k
pedig nincs elfogadó útja. A
Az M-A egy FP -algoritmus
AUTO
képp minden valóban feltett q kérdésre fennáll accN (q) ebbol
AUTO ∈ FPSPP
= = Aut(G)(i) , következés-
megoldásához. Itt az M DPOTM csak olyan q
(G , S i , i, j, π) kérdéseket tesz fel az A orákulumnak, melyekre hS i i
≤
1. A 4.23. tétel 4. része alapján
következik.
= Aut(G)(0) -hoz n szerinti teljes indukcióval mutatjuk meg. Az indukció kezdete az n − 1, S n−1 = {id} pedig (n−1) Az indukciós lépéshez feltesszük, hogy az i-edik természetesen Aut(G) = id-t állítja elo. generátor Aut(G) Az állítást miszerint M-A(G) S 0 kimenete egy eros
(i)
generátor Aut(G) iteráció kezdetekor már rendelkezésre áll egy S i eros hogy az i-edik iteráció végére az S i−1
=
Si
+1 ≤ j ≤ na -ben létezik-e olyan permutáció, amely i-t j-re képezi le. A rákövetkezo
hez. Minden j-hez, ahol i (i−1)
hogy Aut(G)
-hez. Megmutatjuk,
(i−1) generátor Aut(G) ∪ T i−1 halmaz egy eros (G , S i , i, j, π ) ∈ A? kérdéssel megvizsgáljuk,
kérdésekkel eloállítja perxkeresés az A orákulumhoz intézett megfelelo a lexikograkusan (i−1)
legkisebb π permutációt Aut(G)
-ben π (i) = j mellett. Mint fent megállapítottuk ekkor generátor ≤ 1-nek megfelelo q kérdéseket intézünk, mivel S i egy eros (i) (i) Aut(G) -hez, tehát hS i i = Aut(G) . A permutáció eloállítása után az i-edik iteráció végén (i) (i−1) T i−1 Aut(G) egy teljes jobb oldali átlója Aut(G) -ben, következésképp S i−1 = S i ∪ T i−1 A-hoz csak accN (q)
generátor Aut(G) egy eros Aut(G)
= Aut(G)
(0)
(i−1)
generátort -hez. Végül n iteráció után megtalálunk egy S 0 eros
-hoz.
két állításából közvetlenül adódik a 4.27. következmény. A 4.23. tétel elso
4.27. következmény.
GI alsó SPP-re és pp-re, tehát SPPGI = SPP és ppGI = pp.
Gyakorlatok 4.4-1. A≤
p T
B
A
4.14. deníció alapján fennáll A ≤
⇐⇒
P
A
⊆P
B
p T
B
⇐⇒
A
∈
B
P . Mutassuk meg, hogy
.
4.4-2. Mutassuk meg, hogy a 4.5. példában deniált Pre-Iso halmaz NP-beli, valamint hogy az N-P-I algoritmus N gépe egy DPOTM, tehát polinomiális idoben dolgozik.
b és H b gráfokhoz az Iso(G b, H) b izomorz4.4-3. Határozzuk meg a 4.6. példában deniált G muscsoportot. osztályok közül melyek 4.4-4. A következo
ígéret-osztályok: NP és coNP, RP és coRP, AM és coAM, MA és coMA? Tartozhatnak-e az ígéret-osztályokhoz teljes problémák? A válaszokat indokoljuk.
158
4. Bonyolultságelmélet
Feladatok 4-1. Eros NPOTM NPOTM, vagyis a végállapotok Egy eros NPOTM egy három végállapot típussal rendelkezo F halmaza F a , F r és F ? halmazokra bontható. Ekkor teljesül, hogy amennyiben x
∈
A, akkor
B
M (x) rendelkezik egy olyan úttal, ami egy F a -beli állapotban végzodik, és nem rendelkezik olyan úttal, amely F r -beli állapotban végzodik. Ha azonban x
<
B
A, akkor M (x) rendelkezik
egy olyan úttal, ami egy F r -beli állapottal végzodik, és nem rendelkezik olyan úttal, ami B
F a -beli állapottal végzodik. Az M (x) mindkét esetben végzodhet bizonyos utakon F ? -beli NPOTM tehát olyan gép, ami nem tudom válasznak. Az eros két állítást: sosem hazudik. Bizonyítsuk a következo
állapotban, ami megfelel a
•
A≤
NP
•
A≤
NP
sT
sT
B
⇐⇒
NPOTM, mellyel A létezik M eros
B
⇐⇒
NP
A
=
B
L(M ).
⊆ NPB .
Útmutatás. Általánosítsuk a 4.4-1. gyakorlatot. 4-2. Bizonyítás Bizonyítsuk a 4.16. és 4.18. tételek állításait. 4-3. Bizonyítás módosítása Módosítsuk a 4.24. tétel bizonyítását úgy, hogy abból adódjon a 4.25. következmény.
Megjegyzések a fejezethez tömörített A 3. és 4. fejezetek egyes részei a [400] könyvön alapulnak. Amit itt csak erosen formában tudtunk bemutatni, ott megtalálható átfogó és minden technikai részletre kiterjedo változatban, terjedelmes példákkal, nagyobb számokkal, szebb és több ábrával, pontosabb magyarázatokkal és kidolgozottabb bizonyításokkal. Ilyen módon megtalálhatók [400]-ben itt most lemondtunk, mint a 4.16., 4.18. és 4.23. tételek, olyan bizonyítások, melyekrol valamint a 4.20. lemma bizonyításai. Ehhez képest a 3. és ezen 4. fejezet elonye, hogy és pontos. rövid, feszes és tömör, mindazonáltal értheto Bonyolultságelmélethez nagyobb háttéranyag található például a [203, 358, 482, 490] munkájában [470]. A 4.4. és könyvekben. A Turing-gépet Alan Turing vezette be úttöro a 4.5. táblázatot Garey és Johnson [149] készítették. A klasszikus [149] az NP-teljesség elméletéhez még ma is értékes forrásnak számít. A 4.7. tételnél említett több ezer NPteljes probléma egy több száz darabos gyujteménye szintén megtalálható Garey és Johnson [149] könyvében. A 4.10. tétel bizonyítása megtalálható más könyvekben is, például [149] és [358]. A
3-SAT probléma determinisztikus idobonyolultságánál említett oszd-meg-
és-uralkodj algoritmust Monien [336], a lokális keresésen alapuló megoldást pedig Dantsin és társai [98] publikálták. A véletlen séta algoritmus Schöning [416, 418] munkáin alapszik. A
p
≤T -visszavezethetoséget
Cook [87], a
p
≤m -visszavezethetoséget
Karp [241] vezették be.
Ladner, Lynch és Selman [271] cikke átfogó és mélyreható mu a bonyolultság-korlátozott visszavezethetoségek tanulmányozásához. A 4.4-1. gyakorlat, valamint a 4-1. feladat alapjait Selman [423] cikke jelenti. korlátot Dantsin és társai [98] érték el Az eddigi legjobb O(1.481 ) felso n
minisztikus idobonyolultságára k
≥
k-SAT deter-
3 esetén. Schöning itt bemutatott valószínuségi algo-
159
4. Megjegyzések a fejezethez
Algoritmus
Típus
3-SAT
vISSZALÉPÉS
det.
O(1.913 )
4-SAT
O(1.987 )
O(1.995 )
Monien és
det.
O(1.618 )
O(1.968 )
Dantsin et al. [98]
det.
O(1.481 )
O(1.6 )
O(1.667 )
O(1.75 )
Paturi et al. [361]
val.
O(1.362 )
O(1.476 )
O(1.569 )
O(1.637 )
Schöning [416]
val.
Iwama és Tamaki [223]
val.
O(1.324 )
O(1.474 )
n
O(1.928 )
n
n
n
n
n
n
n
O(1.334 )
O(1.5 )
n
n
O(1.6 )
n
n
6-SAT n
O(1.839 )
n
Speckenmeyer [336]
5-SAT n
n
n
n
O(1.966 ) n
n
n
O(1.667 ) n
4.10. ábra. Néhány a kielégíthetoség problémát megoldó algoritmus futási ideje.
ritmusa a mához k
korlátozott lokális keresés ismétléssel [416] ötleten alapszik. A k-SAT problé 4 mellett Paturi és társai [361] algoritmusa kissé még jobb. A jelenlegi legjobb
≥
valószínuségi algoritmus
3-SAT-hoz
és
4-SAT-hoz
Iwama és Tamaki [223] munkáján ala-
algoritmusuk ügyesen ötvözi Paturi et al. [361] és Schöning [416] algoritmusait, pul. Az o és megközelítoleg O(1.324 ) futási idovel rendelkezik. A n
k-SAT
ezen algoritmusa k
≥
5
mellett nem jobb mint Paturi et al. [361] algoritmusa. A 4.10. ábra áttekintést nyújt a fejezetben tárgyalt és néhány további kielégíthetoség problémát megoldó algoritmusról. A jelenlegi legjobb algoritmusok félkövér szedéssel szerepelnek. A grázomorzmus problémával Köbler, Schöning és Torán [247] könyve foglalko zik átfogó jelleggel, elsosorban bonyolultságelméleti szempontok szerint. Hoffman [208] csoportelméleti algoritmusokat vizsgált
GI-hoz.
A 4.11. tételt Ladner [270] publikálta, az
alacsony- és magas bonyolultsági osztályhierarchiákat Schöning [414] vezette be. A 4.13. tételnél használt lexikograkus rendezés megtalálható Rothe [400] cikkében. Gál et al. [155] mutatták meg, hogy teljes izomorzmus konstruálható O(lg n) méretu parciális izomorzmusból két, egyenként n csúcsú izomorf gráfhoz. Ezt az eredményt a 4.13. tétel optimálisra Ezen javítja fel, kimondja, hogy ehhez már egy 1 méretu parciális izomorzmus is elegendo. tétel, valamint a 4.6. példa Größe, Rothe és Wechsung [177] munkájára alapszik. A poli nomiális ido-hierarchiát Meyer és Stockmeyer [323, 440] vezették be, akik bizonyították többek között a 4.16. tétel állításait. Az alsó- és felso-hierarchiát Schöning vezette be [414], valamint bizonyította a 4.18. tétel állításait [414] és megmutatta, hogy Köbler et al. [245, 246] közöltek eloször eredményeket
GI
GI Low2 -beli [415].
alsóságára vonatkozóan való-
színuségi osztályok, mint amilyen pp ellenében. Eredményeiket Arvind és Kurur [20] javították, akik bebizonyították, hogy
GI
még SPP-beli is. Az univerzális hasítás módszerét
Carter és Wegman [69] írták le 1979-ben. A 4.20. lemma Carter és Wegman [69] munkáján alapszik. Az SPP a Valiant [475] által bevezetett UP osztály általánosítása. Az SPP és más
ígéret osztályok alapos tanulmányozásával számos munka foglalkozik, például [20, 56, 127, 194, 245, 246, 382, 399], a 4.23 tételben felsorolt tulajdonságok is megtalálhatók ezen muvekben [127, 246, 247]. A 4.26 tétel bizonyításához szükséges Turingekvivalenciát
AUTO és GI problémák közt Mathlon [312] mutatta meg (lásd még [247]).
Magyar nyelvu, bonyolultságelmélettel foglalkozó szakkönyvek Cormen, Leiserson, Rivest és Stein [90], Lovász [297], Papadimitriou [358], valamint Rónyai Lajos, Ivanyos Gábor és Szabó Réka [392] muve. köszönetet mond Uwe Schöning-nek hasznos észrevételeiért ezen fejezet A szerzo egy korábbi változatához. Leginkább Uwe Schöning eloadásfóliáin alapul a 4.3. alfejezet R-SAT algoritmusának valószínuségi elemzése, amely az eredeti érvelés egy egysze-
160
4. Bonyolultságelmélet
rusítése. Ennek részletesebb elemzése olvasható könyvében [417]. Ezen kívül hálás köszönet illeti Dietrich Stoyant, Sigurd Assingt és Holger Spakowskit a 3. és 4. fejezetek korábbi a Német Kutatási Társaság (Deváltozatainak korrektúra-olvasásáért. Támogatta a szerzot utsche Forschungsgemeinschaft DFG) a RO 1202/9-1 azonosítószám alatt.
II. HÁLÓZATOK
Bevezetés
áll. Ez a rész három fejezetbol Az ötödik fejezet hálózatok szimulációjával foglalkozik. A hatodik fejezet címe Párhuzamos számítások. A fejezetben áttekintést adunk a párhuzamos számításokhoz használt leggyakoribb architektúrákról, bemutatjuk a legnépszerubb informatikai feladaok megoldásra alkalmas párhuszámítási modelleket és végül alapveto zamos algoritmusokat mutatunk be. szóló alapveto ismereteket rendszerezi, A hetedik fejezet a szisztolikus rendszerekrol és bemutatja néhány ismert módszer szisztolikus rendszerekkel való megvalósítását.
5. Hálózatok szimulációja
Ebben a fejezetben olyan módszereket és technikákat tárgyalunk, melyekkel szimulálhatjuk hálózati számítógéprendszerek és alkalmazások muködését. különbözo Egy hálózati rendszer vagy alkalmazás teljesítményének a hálózat zikai megépítését, illetve az alkalmazás o jellemzésére a hálózattervezés és menedzselés területén a szimuláció kibocsátását megeloz az egyik legelterjedtebb módszer.
5.1. A szimuláció típusai 5.1.1. Rendszerek, modellek és diszkrét-esemény szimuláció Egy hálózati rendszer hálózati elemek mint például a forgalomirányítók, kapcsolók, kapcsolatok, felhasználók és alkalmazások olyan halmaza, melynek elemei együttmuködnek valamilyen cél érdekében. A szimulációs tanulmány tárgya lehet egy olyan rendszer is, mely része egy másik rendszernek, mint például egy alhálózat. A hálózati rendszer állapota azoknak a lényeges változóknak és paramétereknek a halmaza, melyek leírják a rendszert egy bizonyos idoben, mely magában foglalja az adott dolog vizsgálatát. Például, ha egy kapcsolat kihasználtságára vagyunk kíváncsiak, akkor csak a link által másodpercenként átvitt bitek számát és a kapcsolat teljes kapacitását akarjuk tudni, és nem a kapcsolat által összekötött kapcsolókban az egyes kapuk számára rendelkezésre álló puffermennyiséget. A hálózat zikai modelljének megépítése helyett egy matematikai modellt építünk, logikai és mennyiségi kapmely tükrözi a hálózatelemek muködését és a közöttük lévo csolatokat. A hálózatelemek közötti kapcsolatok megváltoztatásával a hálózatot annak zikai megépítése nélkül elemezhetjük azt feltételezve, hogy a modell a valós rendszerhez hasonlóan viselkedik, tehát ez egy érvényes modell. Például, a kapcsolat kihasználtságát analitikusan kiszámíthatjuk az U
=
alatt D/T képlet felhasználásával, ahol D az adott ido
elküldött adatmennyiség, T pedig a kapcsolat kapacitása bit/másodpercben. Ez nagyon egyszeru modell, amely ritkán alkalmazható valós feladatok esetén. Sajnos, a problémák nagy kérdéseket egyszeru része túl bonyolult ahhoz, hogy a felmerülo matematikai egyenletekkel megválaszolhassuk. A nagyon bonyolult esetekben a szimulációs technika jobb. A szimulációs modellek többféleképpen osztályozhatók. A leggyakoribb osztályozások a következok.
5.2. A telekommunikációs hálózatok modellezésének és szimulációjának szükségessége
•
165
ol függetlenül Statikus és dinamikus szimulációs modellek. A statikus modell az idot jellemzi a rendszert. A dinamikus modell pedig egy idoben változó rendszert ír le.
•
Sztochasztikus és determinisztikus modellek. Ha a modell egy olyan rendszert ír le, függo elemeket tartalmaz, akkor sztochasztikus modellnek nevezzük, amely véletlentol egyébként determinisztikusnak. A hálózati modelleket megalapozó sorbanállási rendszerek véletlenszeru komponenseket tartalmaznak, mint például a csomagok beérkezési ideje egy adott sorba, a sorok kiszolgálási ideje, egy kapcsoló kapu kimenete stb.
•
Diszkrét és folytonos modellek. A folytonos modell egy olyan rendszert ábrázol, mely nek változói idoben folyamatosan változnak. Például a differenciálegyenletek deniál váltoják az összefüggéseket egyes állapotváltozók változásának a mértékére az ido zása szerint. Egy diszkrét modell egy olyan rendszert jellemez, ahol az állapotváltozók diszkrét idopillanatokban változnak meg. Az egyes események ezekben a diszkrét ido és változtathatják meg a rendszer állapotát. Például, egy pontokban fordulhatnak elo csomag érkezése egy forgalomirányítóhoz egy bizonyos idopillanatban egy olyan esemény, amely megváltoztatja az forgalomirányító kapu-pufferének állapotát. A továbbiakban mi dinamikus, sztochasztikus és diszkrét modelleket tételezünk fel, és
diszkrét-esemény szimulációs modellekként hivatkozunk rájuk. A számítógépes kommunikáció összetett természetének következtében a hálózati modellek is összetettek. A számítógépes programok fejlesztése az egyes szimulációs problé mákra egy lehetoség, de ez nagyon sokáig tart és nem hatékony. Az utóbbi idoben a szi csomagok alkalmazása szokásossá vált, ami megtakarítja a kódolási mulációs és modellezo és lehetové számára, hogy a programozási részletek helyett a moidot teszi a modellezo pillantásra ezeknek a hálózatszimulációs és modellezési problémára koncentráljon. Elso dellezési csomagoknak mint például a COMNET, OPNET használata azzal a veszéllyel jár, hogy a modellezonek meg kell bíznia olyan modellezési technikákban és rejtett eljárá alfejesokban, amelyek jogilag védettek lehetnek, valamint nem nyilvánosak. A következo zetekben azt tárgyaljuk, hogy a szimulációs módszertan hogyan gyozi le az elobb említett félelmeinket az érvényesítési eljárások alkalmazásával, melyek célja, hogy megbizonyosodjunk arról, vajon a valós hálózati rendszer ugyanúgy muködik-e majd, mint ahogyan azt a szimulációs modell elorejelezte.
5.2. A telekommunikációs hálózatok modellezésének és szimulációjának szükségessége 5.2.1. Szimuláció és emuláció Az egyre több adat, számítógép, tároló rendszer és hálózat világában a rendszerek tervezése és menedzselése egyre nagyobb kihívássá válik. Amint a hálózatok gyorsabbá, nagyobbá és bonyolultabbá válnak, a hagyományos számítások már nem ésszeru megközelítései az új hálózati technológiáknál egy új hálózatterv megvalósításának és több millió dolláros befektetéseknek az érvényesítésénél. Ezek a bonyolult számítások és táblázatok már nem meg eszközök a hálózati forgalom sztochasztikus természete, valamint az egész rendszer felelo összetettsége miatt.
166
5. Hálózatok szimulációja
szervezetek egyre inkább azoktól az új hálózati technológiáktól és hálóA különbözo zati alkalmazásoktól függenek, melyek támogatják az üzleti szükségleteiket. Ennek eredményeképp, a gyenge hálózat-teljesítménynek súlyos következményei lehetnek az üzleti alternatív tevékenységúkre nézve. Az egyes tervezési célok eléréséhez tartozó különbözo egyre inkább számítanak az olyan módszemegoldások kiértékelésében a hálózattervezok döntés meghozatala rekre, melyek segítik oket a számos javaslat kiértékelésében a végso és a valódi rendszer megépítése elott. Egy szélesköruen elfogadott módszer a szimulációs használhat egy szimulációs modellt a tervezési teljesítmény-elorejelzés. A hálózattervezo rendszer módosításainak tanulmányováltozatok elemzésére és egy új, vagy egy már létezo zására azok zikai megépítése nélkül. Egy szimulációs modell tükrözheti egy hálózat topológiáját és a hálózatban elvégzett feladatokat, hogy segítségével statisztikai eredményeket kapjuk a hálózat teljesítményérol. Fontos a szimuláció és az emuláció közötti különbség megértése. Az emuláció célja az, hogy utánozza az eredeti hálózatot, és reprodukáljon minden eseményt, amely az egyes hálózatelemekben és alkalmazásokban bekövetkezik. Szimuláció esetén a cél az, hogy olyan amelyek kifejezik az egyes hálózatelemek viselkestatisztikai eredményeket állítsunk elo, dését és funkcióit. Egy diszkrét-esemény szimuláció során meg akarjuk gyelni az esemé nyeket, amint azok megtörténnek az adott idoben, és teljesítmény-jellemzoket szeretnénk mint pélmeghatározni, hogy következtetéseket vonhassunk le a hálózat teljesítményérol, ol, a forgalomirányítók puffereinek médául a kapcsolat-kihasználtságokról, a válaszidokr stb. reteirol A nagyon sok hálózatelemet tartalmazó hálózatok szimulációja esetén olyan nagy mo dellt kaphatunk, amelynek elemezése a szimuláció alatt eloállított nagy mennyiségu statisztika miatt bonyolult. Ezért ajánlatos a hálózatnak csak azon részeit modellezni, amelyek lényegesek a szimulációval megkapni kívánt statisztikákat illetoen. Továbbá szükségszeru, hogy a modell csak azokat a részleteket tartalmazza, amelyek a szimuláció céljai miatt fon általában a következo célokat tuzik tosak. A hálózattervezok ki:
•
Teljesítménymodellezés. Statisztikák eloállítása a kapcsolatok, forgalomirányítók, kap csolók, pufferek stb. teljesítmény paramétereirol.
• •
Hibaelemzés. A hálózatelemek hibás muködése következményeinek elemzése. hálózattervek statisztikáinak összehasonlítása az egyes terHálózattervezés. Különbözo vezési javaslatok követelményeinek kiértékelése céljából.
•
Hálózati eroforrások tervezése. Olyan változtatások hatásának mérése a hálózat teljesítményén, mint pl. az új felhasználókkal, alkalmazásokkal vagy hálózatelemekkel való bovítés. szimulációs modellekre lehet A céloktól függoen ugyanahhoz a hálózathoz különbözo
meg akarja határozni egy protokoll új szolgáltatása által szükség. Például, ha a modellezo okozott többletterhelést a kommunikációs kapcsolatokon, akkor a modell linkjeinek csak egy az új szolgáltatás által eloállított forgalmat kell reprezentálnia. Ha viszont a modellezo alkalmazás válaszidejét akarja vizsgálni maximális forgalom-terhelés esetén, akkor melloz o modellbeli protokoll új szolgáltatásának megfelelo forgalmat. heti az eloz Egy másik fontos kérdés a modell nomsága, azaz hogy milyen szintu részletekig modellezzük az egyes hálózatelemeket. Például el kell döntenünk, hogy egy forgalomirányító felépítését akarjuk modellezni, vagy pedig egy egész csomagkapcsolt hálózatot. Az belso esetben meg kell adnunk a forgalomirányító belso komponenseit, a processzorok száelso
5.3. A telekommunikációs hálózatok típusai
167
mát és sebességét, a buszok típusait, a kapuk számát, a kapu-pufferek mennyiségét továbbá az ezen komponensek közötti kölcsönhatásokat is. De ha alkalmazásszinten akarjuk vizs az egész csomagkapcsolt hálózatban, akkor a forgalomirányítók belso gálni a válaszidot részletei helyett inkább az alkalmazások és protokollok típusait, a hálózat topológiáját és a kapcsolatok kapacitását kell meghatároznunk. Habár a forgalomirányítók alacsonyszintu muködése hatással van a végpontok közötti válaszidore, ennek részletes modellezése az egész hálózatot tekintve nem járul hozzá meghatározóan a szimulációs eredményekhez. A muködési nanoszekundum nagyságrendu belso részletek modellezése nem járul hozzá je lentosen a végpontok közötti mikroszekundum vagy másodperc nagyságrendu késleltetés további pontosságot erosen vizsgálatához. A nagyobb modell-nomságból eredo ellensúlyozza a modell bonyolultsága, és ezeknek a részleteknek a modellbe foglalása által igényelt munka és ido. Az egyszerusítés történhet statisztikai függvények alkalmazásával is. Például a cellahibákat egy ATM hálózatban nem feltétlenül kell úgy modellezni, hogy egy kommunikációs rossz CRC-t a kapcsolaton a cella fejlécében megváltoztatunk egy bitet, ezáltal idézve elo fogadónál. Használhatunk egy statisztikai függvényt is annak eldöntésére, hogy egy cella megsérült vagy elveszett-e, tehát így a cella részleteit nem kell megadnunk a cellahibák modellezéséhez. Ezek a példák azt szemléltetik, hogy a hálózatszimuláció célja nem a hálózat emuláci reprodukciója. ója, hanem a funkcionalitás bizonyos vizsgálatok céljára történo
5.3. A telekommunikációs hálózatok típusai 5.3.1. Modellezési konstrukciók csomópontokból (küldokb és fogadókból) Egy kommunikációs hálózat hálózatelemekbol, ol kommunikációs közegekbol áll. A számos hálózat osztályozási kritéés az oket összeköto használunk: az átviteli technológiát és méretet. A méret vagy távolság rium közül mi kettot szintén meghatározza a hálózatban alkalmazott technikát, amely például lehet vezetékes vagy vezetéknélküli. Két vagy több hálózat összekapcsolását internetworknek nevezzük. A legismertebb internetwork az Internet. Az átviteli technológiától függoen nagyjából két csoportba oszthatjuk a hálózatokat, üzenetszórásos és pont-pont kapcsolatú hálózatok:
•
Az üzenetszórásos hálózatokban egy kommunikációs csatorna van megosztva az összes csomópont között. A kommunikáció úgy történik, hogy a csomópontok a minden más cím csomópont által küldött csomagokat vagy kereteket is megkapják. A keretben lévo határozza meg a címzettet vagy címzetteket, és csak a címzett csomópontok dolgoz zák fel a keretet. Az üzenetszórásos technológiák azt is lehetové teszik, hogy a keretet az összes csomópontnak címezzük. Az ilyen üzenetszórásos kereteket a hálózat összes csomópontja feldolgozza. A kereteket címezhetjük csomópontok egy csoportjának a tagjainak is, vagy közülük egy tetszoleges csomópontnak is. Az elobbit többesküldésnek, az utóbbit bárkinek való küldésnek nevezzük.
•
A pont-pont kapcsolatú hálózatok csomópontpárok közötti kapcsolatok sokaságából ol egy adott címzetthez küldött csomagot vagy keretet esetleg állnak. Itt egy adott küldot
168
5. Hálózatok szimulációja
más csomópontokon keresztül kell továbbítani. Ezek tárolják és továbbítják azt, amíg el nem éri célját. A másik osztályozási szempont, vagyis a lefedett zikai terület nagysága alapján a kö vetkezoképpen csoportosíthatjuk a hálózatokat:
•
A személyes hálózati környezetek (Personal Area Network PAN) egy adott személy egérbol és PDA-ból ( Personal Digital igényeit elégítik ki. Például egy billentyuzetb ol, Assistant Digitális Személyi Asszisztens mozaikszava) álló, vezetéknélküli hálózat egy személyes hálózati környezetnek. tekintheto
•
A helyi hálózatok (Local Area Network LAN) egy korlátozott méretu területet fednek le, tipikusan magánszemélyek, részlegek, kisebb otthoni szervezetek vagy épületek adott emeletei birtokolják oket. A helyi hálózat munkaállomásokat, kiszolgálókat és megosztott eroforrásokat kapcsol össze. A LAN-ok csoportosíthatók továbbá az átviteli technológia (melynek sebességét bit/másodpercben mérjük) és a hálózati topológia szerint. Az átviteli technológiák sebessége a hagyományos 10 Mbps-tól 10 Gbps sebességuig terjed. Topológia szerint vannak busz és gyur u hálózatok, továbbá kapcsolt LAN-ok.
•
A városi hálózatok (Metropolitan Area Network MAN) nagyobb területet hidalnak át, például egy várost. Egy szélesköruen alkalmazott MAN a kábel-tv hálózat, amely nem csak az egyirányú TV adásokat, hanem kétirányú Internet szolgáltatásokat is biztosít az átviteli spektrum nem használt részében. Más MAN technológiák például az optikai szálas elosztott adatinterfész és a következokben tárgyalt vezetéknélküli IEEE (Institute of Electrical and Electronical Engineers) technológiák.
•
A nagy kiterjedésu hálózatok (Wide Area Network WAN) nagy földrajzi területet fednek le, egy államot, országot vagy akár egy kontinenst is. Egy WAN alhálózatokban és szerverekbol) áll. Az alhálózatok továbbítják összekapcsolt hosztokból (kliensekbol az üzeneteket a forrástól a cél hosztig. Egy alhálózat tartalmazhat számos átviteli vonalat, melyek mindegyike speciális hardver eszközöket, úgynevezett forgalomirányítókat közeg is lehet, rézdrót, optikai üvegszál, kapcsol össze. Az átviteli vonal több különbözo vezetéknélküli kapcsolat stb. Mikor egy üzenetet el kell küldeni egy vagy több hosztnak, az üzenetet kisebb részekre osztja, melyeket csomagoknak nevezünk. Amikor a küldo egy csomag megérkezik egy átviteli vonalon, a forgalomirányító tárolja azt, kiválaszt vonalat és azon továbbítja. A kimeno vonal kiválasztása egy forgalomiráegy kimeno nyítási algoritmus alapján történik. Végül az egyesével továbbított csomagokból a cél hoszt(ok) újra összeállítják az eredeti üzenetet. osztályokba sorolhatók: rövidtávú rádióA vezetéknélküli hálózatok a következo
hálózatok, vezetéknélküli LAN-ok és vezetéknélküli WAN-ok.
•
Rövidtávú hálózatoknál az egyes eszközök 610 méteren belül vannak összekapcsolva komponensek, rövidtávú rádiókapcsolatokkal. Ilyenek például a Bluetooth, a különbözo digitális kamerák, a globális helymeghatározó rendszer ( Global Positioning System GPS) eszközei, a fejhallgatók, számítógépek, szkennerek, monitorok és billentyuze rendszeregység, tek. A komponensek elsodleges-másodlagos viszonyban vannak. A fo az elsodleges komponens irányítja a másodlagos komponensek muködését. Az elsodleges komponens határozza meg, hogy milyen címeket használnak a másodlagos eszközök, továbbá, hogy melyik frekvenciákon továbbíthatnak adatokat.
5.4. Teljesítményjellemzok szimulációhoz
•
169
és rádió-modemmel és antennával felszerelt A vezetéknélküli LAN számítógépekbol hozzáférési pontokból áll, melyek lehetové teszik az adatok küldését és fogadását. A számítógépek kommunikálhatnak egymással közvetlenül vagy egy hozzáférési ponton keresztül, ami más hálózatokhoz is kapcsolhatja oket. A lefedett terület általában 100 méter körül van. A vezetéknélküli LAN protokollok az IEEE 802.11 szabványok családjába tartoznak, és 11-108 Mbps sebességet biztosítanak.
•
A vezetéknélküli WAN-ok lehetnek kis és nagy sávszélességu hálózatok is. A kis sávszélességu rádió-hálózatok eddig kifejlesztett három generációját a celluláris telefon generációt csak hang-kommunikációra tervezték, ez rendszerek használják. Az elso analóg jelzést használt. A második generáció szintén csak hangot továbbított, de digitális átviteli technológiára alapozva. Az aktuális harmadik generáció digitális és hangot és adatokat is továbbít legfeljebb 2 Mbps sebességgel. Negyedik és további generációs celluláris rendszerek is fejlesztés alatt vannak. A nagy sávszélességu WAN-ok a telefonrendszerek használatát elkerülve biztosítanak nagy sebességu hozzáférést az ottho Az IEEE 802.16 szabvány az IEEE 802.11 szabvánnyal ellentétben nokból és cégektol. épületekhez és nem mobil állomásokhoz továbbítja a szolgáltatásokat, és sokkal magasabb, 1066 GHz frekvencia-tartományban üzemel. A távolság az épületek között több kilométer is lehet.
•
Interneten keresztül elA vezetékes és vezetéknélküli otthoni hálózatok a különbözo, eszközök összekapcsolásával egyre inkább népszerubbek érheto lesznek. Az otthoni laptopokból, PDA-kból, TV-kbol, DVD-kbol, videókahálózatok állhatnak PC-kbol, hut lámpákból, merákból, MP3 lejátszókból, mikrohullámú sütokb ol, oszekrényekb ol, stb. Sok háztartás ma már fel van szerelve nagy riasztókból, kihasználtság-mérokb ol sebességu Internet-hozzáféréssel (kábel modem, DSL stb.), amin keresztül igény szerint tölthetnek le zenét és lmeket.
komponensei és típusai megfelelnek a szimulációs A kommunikációs hálózatok különbözo lépéseinek. Tipikusan a hálózati topológiát épímodellépítés konstrukcióinak és különbözo tik fel eloször, majd hozzáadják a forgalom forrásait, céljait, a terhelést és a hálózati mukö paraméterek meghatározzák a kísérledés paramétereinek beállítását. A szimulációt vezérlo a szimuláció alatti és utáni elemzéstet és a szimuláció lefutását. A szimuláció indítása elott statisztikai jelentések aktiválhatók. Statisztikai eloszlások állnak rendelkehez különbözo zésre ahhoz, hogy leírjuk a beépített analitikus eloszlások speciális paraméterezéseit. Amint új modellkönyvtárakat készíthet, melyek újra felhasználhaa modell elkészült, a modellezo tók más modellekben is.
5.4. Teljesítményjellemz®k szimulációhoz 5.4.1. Teljesítménymértékek listáját tekintjük át, Ebben az alfejezetben a hálózatok olyan jellemzoinek egy nem kimeríto melyek meghatározó hatással vannak a hálózat teljesítményére. Általában ezek a jellemzok képezik a hálózat-modellezésnek, azaz a számítógéphálózatok statisztikai elemzésének, tervezésének és optimalizálásának céljait. Alapvetoen a hálózatmodelleket úgy készítjük,
170
5. Hálózatok szimulációja
hogy megadjuk egy sorbanállási rendszerben az igény érkezési és kiszolgálási intenzitások statisztikai eloszlását, ami azután meghatározza ezeket a jellemzoket.
•
Kapcsolat kapacitás. A csatorna vagy kapcsolat-kapacitás a kapcsolat által idoegységenként továbbított üzenetek száma. Ezt általában bit/másodpercben mérik. Az információelmélet egyik leghíresebb eredménye Shannon csatornakódolási tétele:
Minden csatornára létezik olyan kód, ami lehetové teszi a csatornán való hibamentes adattovábbítást R intenzitással, feltéve, hogy R
≤
C, ahol C a csatorna kapacitása. Egyenloség
csak akkor lehetséges, ha a jel/zaj hányados ( Signal-to-Noise Ration SNR) végte len.
•
Sávszélesség. A sávszélesség a hálózati jelek számára rendelkezésre álló legalacsonyabb és legmagasabb frekvenciák közötti különbség. A sávszélesség kifejezést szintén használják egy adott kapcsolat vagy protokoll áteresztoképességének leírására, kilobit, megabit, terabit stb. /másodpercben mérve.
•
amire a hálózati rendszernek szüksége van ahhoz, Válaszido. A válaszido az az ido, tartalmazza a célállomáshoz hogy megválaszolja egy igényforrás kérését. A válaszido a forrásnál, a célnál, valamint a közbeeso hávaló továbbítás idejét, a feldolgozási idot lózatelemeknél, továbbá tartalmazza a válasznak a forráshoz való átvitelének idejét. Az a hálózat teljesítményének fontos mértéke. A felhasználók számára átlagos válaszido a legkedvezobb. statisztikáknak (átlag és szórás) a minél kisebb válaszido A válaszido állandóknak kell lenniük, és nem szabad, hogy napszaktól függjenek. Meg kell jegyez nem garantálja azt, hogy nem lesznek nünk viszont, hogy az alacsony átlagos válaszido is. hálózati torlódások miatt rendkívül hosszú válaszidok
•
Késés. A késés vagy késleltetés az az idomennyiség, ami egységnyi adatnak egy hálózati kapcsolaton való továbbításához szükséges. A késleltetés és a sávszélesség az a két té ami meghatározza egy kapcsolat sebességét. A késleltetés tartalmazza a terjedési nyezo, ami alatt az elektronikus vagy optikai jelek megteszik a két pont késleltetést (azt az idot, Például egy földi állomásnak egy másik földi közötti távolságot) és a feldolgozási idot. állomással való muholdas kommunikációs kapcsolatának késése (legalább 34000 km mindkét út) körülbelül 270 milliszekundum. Az USA keleti és nyugati partjai közötti válaszolási késleltetés körülbelül 100 milliszekundum, globálisan 125 milliszekundum. álló adatútnak a forrás és cél végpontok közötti késleltetését Egy több szegmensbol hálózati eszközök, fornem csak a jel terjedési sebessége, hanem az útvonalon lévo galomirányítók, kapcsolók is befolyásolják, melyek tárolják, feldolgozzák, irányítják, kapcsolják, és becsomagolják az adatokat. A hibás csomagok és cellák, a jelveszteség, a kapcsolat és eszközhibák, valamint túlterhelések szintén hozzájárulnak a hálózati késleltetéshez. Hibás cellák és csomagok esetén szükség van azoknak a forrástól való teljes újraküldésére. Az ilyen a csomagokat általában eldobják azt feltételezve, hogy késobb újraküldik oket. Ez lassulást és a pufferek túlcsordulását okozhatja.
•
Forgalomirányító protokollok. A forrástól a célig a hálózati forgalom valamilyen útvonalon halad keresztül. Egy helyi hálózatban ez az útvonal nem egy problémás kérdés, mivel csak egy út lehetséges bármely forrás és cél között. Ha viszont a hálózat számos céget kapcsol össze számos útvonallal, forgalomirányítóval és kapcsolattal, a legjobb út vagy útvonalak megkeresése igen fontossá válik. Egy útvonal többféle különbözo kapacitású, késleltetésu és megbízhatóságú kapcsolatból állhat. Létesítésük forgalomirányító protokollok segítségével történik. Ezeknek a protokolloknak az a célja, hogy a
5.4. Teljesítményjellemzok szimulációhoz
171
torlódást elkerülve egy optimális, vagy közel optimális útvonalat találjanak a forrás és a cél között.
•
Forgalomszervezés. A forgalomszervezés koncepcióját felhasználva jelenleg egy újfajta forgalomirányítási technikát fejlesztenek. A folyamatos hálózatkapacitás-növelés he lyett inkább a hálózati eroforrások optimális kiosztását alkalmazzák a torlódások elkerülésére. A forgalomszervezést úgy valósítják meg, hogy a forgalomfolyamokat a cél zikai hálózati topológiára képezik le elore meghatározott útvonalak mentén. Fo a forgalomirányítók és kapcsolók továbbító kapacitásainak optimális kiosztása. A for galomszervezés megteremti annak lehetoségét, hogy a forgalomfolyam eltérjen a hagyományos forgalomirányítási protokollok által kiszámított optimális útvonaltól egy kevésbé zsúfolt hálózatrész felé. Kiegyenlíti a terhelést a kapcsolatokon, forgalomirányítókon és kapcsolókon úgy, hogy ezen hálózatelemek egyike se legyen túl kevéssé vagy túlságosan is kihasználva.
•
Protokoll többletterhelés. A protokollüzenetek és az alkalmazások adatai protokolladategységekbe vannak ágyazva, mint például keretek, csomagok és cellák. A hálózat egyik fo aggálya a protokollok többletterhelése. Ez a többletterhelés a követtervezok kérdést veti fel. Valójában milyen gyorsan tudunk adatokat továbbítani egy adott kezo kommunikációs útvonallal és protokollcsomaggal, azaz mekkora sávszélesség marad valójában az alkalmazásoknak? A legtöbb protokoll további többletterhelést is bevezet sávszélességen belüli protokoll-menedzselési funkciókkal kapcsolatban. A kapcsolat és ellenorz o üzenetek, a poll, select és fenntartó csomagok, hálózati riasztások, vezérlo jelzoüzenetek különbözo az adatfolyamokkal együtt továbbítódnak.
•
ingadozása. Eros ingadozás. A hálózati torlódás leggyakoribb oka a forgalom eros Egyes nem régi eredmények nyilvánvalóvá tették a nagy sebességu Internet forgalmá nak erosen ingadozó voltát és azt, hogy a változékonysága a korábbi feltételezésekkel elore. szemben nem jelezheto Megmutatták, hogy a hálózati forgalom gyakran hasonló statisztikai tulajdonságokkal rendelkezik. A gyakran vagy mindig erosen ingadozó forgalom statisztikailag leírható a hosszú távú függoség fogalmának felhasználásával. A forgalomnak mindig meggyelheto eros ingadozása. Az elobbiek hosszú távon függo adatfolyamok összekeverése, mint ahogyan egyik következménye az, hogy a különbözo az az Interneten is történik, nem eredményez egyenletes forgalmat. A helyi és nagy kiterjedésu hálózatokban végzett mérések bebizonyították, hogy a szélesköruen használt Markov-folyamaton alapuló modellek nem alkalmazhatók napjaink hálózati forgalmá ingadozás kiegyenlítodne nak leírására. Ha a forgalom Markov-folyamat lenne, az eros egy hosszú idointervallum átlagolása során, ellentmondva a meggyelt forgalomjellem zoknek. Az erosen ingadozó forgalom káros következményeit a 5.9. alfejezetben lévo esettanulmányban vizsgáljuk meg.
•
gyakran aggódnak a nagyméretu Keret méret. A hálózattervezok keretek miatt, ugyanis az ilyen elveszett keretek és újraküldésük esetén sokkal gyorsabban fel tudják tölteni a forgalomirányítók puffereit mint a kisebbek. Mivel a feldolgozási késleltetés ugyanakkora a nagyobb kereteknél, mint a kisebbeknél, azaz a nagyobb csomagok látszólag hatékonyabbak, de a forgalomirányítók és kapcsolók gyorsabban fel tudják dol soraikat kisebb csomagok esetén. A nagyobb keretek esetén szükség lehet gozni a belso azok feldarabolására is, mivel a maximális adatátviteli egység ( Maximum Transmis sion Unit - MTU) mérete korlátozza a méretüket. Az MTU egy olyan paraméter, ami
172
5. Hálózatok szimulációja
legnagyobb csomag méretét. Másrészt, a meghatározza egy IP interfész által átviheto kisebb keretek több ütközést okozhatnak az Ethernet hálózatokban vagy kisebb kihasználtságot a WAN kapcsolatokon.
•
Az eldobott csomagok aránya. A csomagok az OSI architektúra adatkapcsolati és hálózati rétegében kerülhetnek eldobásra. A szállítási réteg puffereket kezel a nyugtázat lan csomagok számára, és szükség esetén újraküldi oket, hogy ezáltal egy hibamentes és a fogadó között. Az alsóbb rétegekben eldobott csokapcsolatot biztosítson a küldo magok aránya meghatározza a szállítási rétegben újraküldött csomagok arányát. A for pufferek hiánya miatt is eldobhatnak csomagokat. galomirányítók és kapcsolók a belso Ha a WAN kapcsolatok zsúfolttá válnak, akkor a pufferek gyorsabban feltöltodnek, ami pedig idotúllépéseket és újraküldéseket okoz a szállítási rétegben. A TCP lassú indulás folyamatos becslésével és a továbbítási intenzitásnak a korábbi algoritmusa a válaszido beállításával próbálja elkerülni a torlódást. ingadozásától függo
5.5. A forgalom jellemzése 5.5.1. Hálózati statisztikák függo jellemzokkel A kommunikációs hálózatok véletlentol továbbítják az adatokat. A há lózat jellemzoinek mértékei véletlen folyamatokból vett statisztikai minták. Ilyen például a a kapcsolat kihasználtság, az üzenetek beérkezési idoköze válaszido, stb. Ebben az alfejezetben áttekintjük a hálózatmodellezésben és teljesítménybecslésben legfontosabb statisztikákat. eloszlástípus kiválasztása után a következo A vizsgált hálózatjellemzonek megfelelo lépés az eloszlás paramétereinek becslése. Erre sok esetben a minta átlagát vagy közepét és szórását használják. A fejlettebb szoftver-eszközök tartalmazzák a szükséges számításokat mint az az érték, ami körül a minta értéezekhez a becslésekhez. Az átlag úgy értelmezheto, egyenletek akkor alkalmazhatók, ha rendelkezésre állnak kei csoportosulnak. A következo diszkrét vagy folytonos alapadatok. Legyen X1 , X2 , . . . , Xn a rendelkezésre álló, n méretu képlet adja meg: minta. Ennek az átlagát a következo
Pn
X A minta S
2
i= 1
=
Xi
n
.
szórásnégyzete pedig a következoképpen deniálható:
Pn S
2
=
i=1
Xi n
2
− nX
2
.
−1
Ha az adatok diszkrétek és egy gyakorisági eloszlásba vannak csoportosítva, akkor az elobbi egyenletek a következoképpen módosulnak: k P
X
= k P
S
2
=
j=1
j=1
f jX j
,
n f jX j n
2
− nX
−1
2
,
173
5.5. A forgalom jellemzése
eloszlás
paraméter(ek)
becslés(ek)
Poisson exponenciális
α λ
egyenletes
b
normális
µ, σ2
α = X λ = 1/X = ((n + 1)/n)[max(X)] (torzítatlan) b µ = X 2 2 σ = S (torzítatlan)
5.1. ábra. Leggyakoribb eloszlások paramétereinek becslése.
értékeinek száma, f j pedig az X j érték gyakorisága. Az S szórás az ahol k az X különbözo S
2
szórásnégyzet négyzetgyöke. A szórásnégyzet és a szórás szemlélteti a mintáknak az átlagérték körüli eltérését. A kis
középre irányuló tendenciáját mutatja. A nagy eltérés viszont eltérés a mintáknak egy eros, kis tendenciát és nagy statisztikai véletlenszeruséget mutat. Az eloszlás paramétereinek numerikus becslései azért szükségesek, hogy az adott eloszláscsaládot egy eloszlásra redukálhassuk és tesztelhessük az adott feltevést. Az 5.1. ábra a hálózatmodellezésben eloforduló leggyakoribb eloszlások paramétereinek becsléseit foglalja össze. Jelölje
σ2
α
az adott paramétert, α pedig a becslését. Ha eltávolítjuk a torzítást a
a normális eloszlásnál és a b-étol az egyenletes eloszlásnál, akkor ezek a becslésétol
becslések a mintaadatokon alapuló maximum likelihood becslések. A valószínuségeloszlások a valós világban eloforduló véletlenszeru változásokat írják le. Habár a változásokat véletlennek nevezzük, a véletlenszeruségnek vannak különbözo eloszlások megfelelnek annak, ahogyan a változások bekövetkezmértékei; a különbözo eloszlásokat különbözo szimulációs célokra használják. A valószínek. Ezért a különbözo nuségeloszlások eloszlásfüggvényekkel vannak reprezentálva. Ezek megmutatják, hogy egy bizonyos érték mennyire valószínu. A kumulatív eloszlásfüggvény annak a valószínuségét vagy annál kisebb értéket választunk. Például, adja meg, hogy egy bizonyos értekkel egyezo, az eloszlásból választva az ha a kumulatív eloszlásfüggvény az 1 értéknél 0.85, akkor ebbol esetek 85%-ában 1-nél kisebb számot kapunk. A kumulatív eloszlásfüggvény értéke egy sur adott pontban megegyezik a megfelelo uségfüggvény-görbe alatt a ponttól balra lévo 1-gyel, ezért a kumulatív elterülettel. Mivel a sur uségfüggvény alatti teljes terület egyenlo oszlásfüggvény 1-hez tart, ahogyan a pozitív irányban haladunk elore. A modellezési esetek többségében a modellezonek nem kell tudnia minden részletet ahhoz, hogy sikeresen felé pítsen egy szimulációs modellt. Elég azt tudnia, hogy melyik eloszlás a legmegfelelobb az adott esetre. sur Most ismertetjük a leggyakoribb statisztikai eloszlásokat. A megfelelo uségfügg vények ábrázolására a COMNET szimulációs modellezési eszközt használjuk. Gyakorlati az összes elofordulás szempontból egy sur uségfüggvény egy hisztogrammal közelítheto gyakoriságainak valószínuségekké való konvertálásával.
•
Normális eloszlás. Tipikusan egy összetett folyamat eloszlásának modellezésére használható, ahol a folyamat komponens folyamatok összegeként írható le. Például, egy fájl a fájlt felépíto blokkok átviteli idejeinek az hálózaton való átvitelének ideje (válaszido) eszközökben a normális eloszlás két pozitív vaösszegével egyezik meg. A modellezo lós számmal adható meg: a várható értékkel és a szórással. A függvényértékek szintén pozitív valós számok. Az x paraméter azt adja meg, hogy melyik véletlen számsoroza-
174
5. Hálózatok szimulációja
Normal(1, standard deviation, x) 2.00 1.80 std. dev. = 0.2
1.60 1.40 1.20 1.00 0.80 std. dev. = 0.4
0.60 0.40
std. dev. = 0.6
0.20 0.00 0.00
0.50
1.00
1.50
x
2.00
2.50
3.00
3.50
4.00
5.2. ábra. Normális eloszlás.
tot alkalmazzuk a mintakészítéshez. Ez az eloszlás szintén gyakran használt üzenetek méretének modellezésére. Például, egy üzenet leírható 20000 bájt átlagos mérettel és 5000 bájt szórással.
•
fügPoisson-eloszlás. Ez az eloszlás az egy bizonyos idointervallumban bekövetkezo getlen események elofordulásának számát modellezi. Például egy csomagfolyamból egy cél által egy másodperc vagy perc alatt megkapott csomagok számát. A modellezo eszközökben a Poisson-eloszlás egy pozitív valós számmal, a várható értékkel adható meg. A
szám paraméter az 5.3. ábrán azt adja meg, hogy melyik véletlen számsoro zat lesz alkalmazva a mintakészítéshez. Amikor ez az eloszlás egy idointervallummal együtt van megadva és egy egész számot ad, olyankor gyakran használják az adott inter beérkezések számának leírására. Szimulációkor viszont sokkal vallumban bekövetkezo hasznosabb, ha ez az információ a beérkezések közötti idoközként van kifejezve. Erre a célra az exponenciális eloszlást használják.
•
moExponenciális eloszlás. Ez az eloszlás a független események között eltelt idot dellezi, mint például a csomagfolyam egy forrása által küldött csomagok esetén a be érkezési idoközt. Fontos megjegyezni, hogy ha az események bekövetkezése közötti exponenciális, akkor a bekövetkezett események száma Poisson-eloszlású. A moido eszközökben az exponenciális eloszlás egy pozitív valós számmal, az eloszlás dellezo várható értékével, és egy x paraméterrel adható meg, ami pedig azt mondja meg, melyik véletlen számsorozatot alkalmazzuk a mintakészítéshez. Az eloszlás további alkalmazási területei még például: adatbázis tranzakciók, billentyu leütések, fájl hozzáférések, elektronikus levelek, névfeloldási kérések, HTTP lekérdezések, X-window protokoll modellezése. üzenetváltások stb. közötti idok
•
Egyenletes eloszlás. Az egyenletes eloszlás olyan adatokat modellez, melyek egy in valószínuséggel. tervallumból vesznek fel értékeket, mindegyiket egyenlo Az eloszlás teljesen meghatározható a legkisebb és a legnagyobb lehetséges érték megadásával. diszkrét egyenletes eloszlás is használható. A csoDiszkrét adatok esetén a megfelelo
175
5.5. A forgalom jellemzése
5.3. ábra. Poisson-eloszlás. Exponential(1, x) 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0
0.5
1
1.5
2
x
2.5
3
3.5
4
4.5
5
Exponential(main, stream)
5.4. ábra. Exponenciális eloszlás.
eszközökben ez maghosszakat gyakran modellezik egyenletes eloszlással. A modellezo ketto a legkisebb és a az eloszlás három pozitív valós számmal adható meg. Az elso legnagyobb lehetséges értéket adja meg, a harmadik pedig azt, hogy melyik véletlen számsorozat legyen alkalmazva a mintakészítéshez.
•
Pareto-eloszlás. A Pareto-eloszlás egy hatvány típusú eloszlás erosen ingadozó tulaj források modellezésére (nem hosszú távon függo forgalomra). donsággal rendelkezo három Az eloszlás erosen csúcsos, de a vége lassan csökken. Megadása a következo paraméterrel történik: hely, alak és eltolás. A hely megadja ahol az eloszlás kezdodik, az alak meghatározza, hogy a vége milyen gyorsan ereszkedik, az eltolás pedig eltolja az eloszlást. A valószínuségeloszlások egy közös alkalmazási célja az, hogy deniálják a hálózatok
paramétereit. A hálózatok egy tipikus modellezési célú paramétere több üzenet különbözo A megadott idon egy üzenet indulásától a következo üzeesetén az üzenetek közötti ido. értjük. Ahogyan azt korábban tárgyaltuk, a beérkezési idoközökre net indulásáig eltelt idot leggyakrabban használt eloszlás az exponenciális. Az exponenciális eloszlás számára megadandó paraméterek a várható érték és a véletlen folyamszám. A hálózati forgalmat gyakran írják le Poisson folyamatként. Ez általában azt jelenti, hogy az üzenetek számát gyelték
176
5. Hálózatok szimulációja
Uniform(3, 7, x) 0.25
0.2
0.15
0.1
0.05
0 1
0
2
3
x
4
5
6
7
8
5.5. ábra. Egyenletes eloszlás.
Pareto Distribution (offset=0)
1.6
location=1, shape=1.5
Pareto (location, shape, offset, x)
1.4
1.2
1 location=1, shape=0.95
0.8
0.6
0.4
0.2
location=5, shape=0.95
0 0
2
4
6
x
8
10
12
14
Pareto(location, shape, offset, stream) 5.6. ábra. Pareto-eloszlás.
idointervallumokban, meg egymást követo és a meggyelések száma egy intervallumban eszközökben nem az idoegységenkénti Poisson-eloszlású. A modellezo üzenetek számát
5.5. A forgalom jellemzése
177
5.7. ábra. Exponenciális eloszlás átlagosan 10 másodperces beérkezési idoközzel.
5.8. ábra. Az Exp(10.0) beérkezési idoköz sur uségfüggvénye.
nem adják meg, hanem inkább az üzenetek beérkezési idoközét. Bebizonyítható, hogy ha az egységnyi idointervallumonkénti üzenetszám Poisson-eloszlású, akkor a beérkezési ido köz exponenciális eloszlású. A 5.7. ábrán látható párbeszédablakban a beérkezési idoköz eloszlás COMNET-ben az Exp(10.0) kifejezéssel van deniálva. Ez azt jelenti, hogy az egy üzenet indulása közötti ido exponenciális eloszlást követ 10 üzenet és az utána következo sur uségfüggvényt szemlélteti. másodperces átlaggal. A 5.8. ábra a megfelelo
178
5. Hálózatok szimulációja
5.9. ábra. Anomáliák a kerethosszakban.10-es ábra!!!
forgalomfolyamok szimulációjára összpontoTöbb szimulációs modell is a különbözo sít. A forgalomfolyamok szimulálhatók egyrészt a forgalom feltételezett jellemzoinek megadásával, vagy pedig a tanulmányozott alkalmazás muködése során nyert valódi adatok fel alfejezetben fogjuk tárgyalni. használásával megalapozva. Ez utóbbit a következo általában a hálózatról meglévo adatok elemzésével kezdik a moA hálózatmodellezok ol. Ez segíti az alkalmazási szindellezést, hogy ezáltal képet kapjanak a hálózat jellemzoir folyamatok elég mély megértését ahhoz, hogy az egyes hálózatelemeket a modelten lévo lezési konstrukciókhoz tudják rendelni. Különféle eszközök is használhatók a modellépítés gyelmen kívül hagyhatja az olyan folyamaelott. Az elozetes elemzés után a modellezo tokat és eseményeket, amelyek nem fontosak a szóban forgó tanulmányban. Például, az adatbázis tranzakciókról nyert adatok a kerethossz nagy változékonyságát mutatják. Az 5.9. ábra segít elképzelni ezeket anomáliákat. Ugyanezeknek az adatoknak a vizsgálata (19.1. ábra) a keretek beérkezési idoközeinek nagy változékonyságát is felfedi. A kumulatív valószínuségeloszlás-függvény közelítésével például a kerethosszak hisz az eloszlástípus meghatározásában. togramja (5.11. ábra) segíti a modellezot
5.6. Szimulációs modellez® rendszerek 5.6.1. Adatgy¶jt® eszközök és hálózatelemz®k Ebben az alfejezet összefoglaljuk a szélesköruen alkalmazott OPNET és COMNET jellemzoit, diszkrét-esemény szimulációs eszközök fo és az ezeket támogató hálózatelem Környezetét. zoket, a Network Associates Sniffer-ét és a az OPNET Alkalmazásjellemzo Az OPNET ( Optimized Network Engineering Tools Optimalizált hálózattervezo egy szélesköruen alkalmazható szimulációs rendszer, mely alkalmas kommu-
eszközök)
nikációs hálózatok és elosztott rendszerek modellezésére részletes protokoll és teljesítmé-
5.6. Szimulációs modellezo rendszerek
179
5.10. ábra. A beérkezési idoközök nagy változékonysága. Az ábra színes változata megtalálható a 807. oldalon.
5.11. ábra. A kerethosszak hisztogramja. Az ábra színes változata a 807. oldalon látható.
nyelemzéssel. Az OPNET számos eszközt tartalmaz, melyek a modellezési és szimulációs projektek egyes szakaszainak megfeleloen három kategóriába sorolhatók. Ezek a szakaszok a következok: modellspecikáció, adatgyujtés és szimuláció, valamint az elemzés.
180
5. Hálózatok szimulációja
5.6.2. Modellspecifikáció a tanulmányozott hálózati rendszer egy reprezenA modellspecikáció során a modellezo tációját hozza létre. Az OPNET támogatja a modellek újrafelhasználását, azaz a modellek alapozhatók olyan beágyazott modellekre, melyeket korábban készítettek el és modell szintu könyvtárakban tároltak. A specikációszerkesztokkel a modellek különbözo rész az aktuális hálózati rendszer hierarchikus letezettséggel adhatók meg. Ezek a szerkesztok struktúrájának megfeleloen osztályokba sorolják az modellezési információkat. A legmaga a Projektszerkeszto sabb szintu szerkeszto, alakítja ki a hálózati topológiák, alhálózatok, és álló hálózatmodelleket, melyeket pedig a Csomópontszerkesztovel kapcsolatok modelljeibol írja le a csomópontok belso szerkezetét, funkcioadhatunk meg. A Csomópontszerkeszto adatfolyamokat. A csomópontok olyan folyamatmodellnális elemeiket és a közöttük lévo modulokból állnak, melyeket a Folyamatszerkesztovel adhatunk meg. A hálózat hierarchiájának legalacsonyabb szintjén a folyamatmodellek írják le az adott modul viselkedését a protokollokkal, algoritmusokkal és alkalmazásokkal kapcsolatban, véges automatákat és egy magasszintu nyelvet felhasználva. is elérheto a folyamat- vagy csomópont-szintu Számos más szerkeszto modellek által adatmodellek deniálására, mint amilyenek például a csomagformáhivatkozott különbözo tumok és a folyamatok közötti vezérloinformációk. További szerkesztokkel készíthetünk, sur módosíthatunk vagy csak megtekinthetünk különbözo uségfüggvényeket, melyekkel kü eseményeket irányíthatunk. Ilyen például a csomagok küldése vagy fogadása kölönbözo meghatározása. A modellspecikáció-szerkesztok egy grakus felületet bizzött eltelt ido tosítanak a felhasználónak, mellyel változtathatja a modelleket ábrázoló objektumokat és a folyamatokat. Mindegyik szerkeszto a modell egy adott absztrakciós szintjének megfelelo objektumokat és muveleteket adja meg megfelelo adhatja meg. Ezért a Projektszerkeszto a processzorokat, sorokat a hálózat csomópontjait és kapcsolatait, a Csomópontszerkeszto adó és fogadó egységeket, a Folyamatszerkeszto pedig a és a hálózat csomópontjaiban lévo absztrakciós szintjeit folyamatok állapotait és átmeneteit. A 5.12. ábra az egyes szerkesztok szemlélteti.
5.6.3. Adatgy¶jtés és szimuláció Az OPNET a szimuláció alatt többféle kimenetet tud készíteni attól függoen, hogy a model ezt hogyan deniálja. A modellezok legtöbb esetben beépített adattípusokat is használlezo hatnak: kimenetvektorokat és skalárokat, valamint animációkat.
•
A kimenetvektorok idosorozatok szimulációs adatait reprezentálják. Ezek a vektorok értéke ido-érték párokat tartalmazó bejegyzések listájából állnak. A bejegyzések elso a független, a második pedig a függo változónak. tekintheto
•
A skaláris statisztikák a szimuláció alatt gyujtött statisztikákból származtatott egyedi értékek. Ilyen például az átlagos átviteli ráta, az eldobott cellák számának maximuma, és más egyéb statisztikák. az átlagos válaszido
•
animációkat is tud készíteni. Az OPNET a szimuláció alatt vagy az után megtekintheto deniálhat többféle animációt is, például csomagfolyamokat, állapotátmeA modellezo neteket és statisztikákat.
5.6. Szimulációs modellezo rendszerek
181
adják meg. 5.12. ábra. A három absztrakciós szintet a Projekt-, Csomópont- és Folyamatszerkesztok
5.6.4. Elemzés A szimuláció alatt összegyujtött adatok többsége kimenetvektor és skalár állományokban tárolódik. Ezeknek az adatoknak az elemzésére az OPNET egy Elemzoeszköz nevu segédeszközt nyújt, amely ábrázoló és numerikus feldolgozó-funkciók gyujteménye. Az Elem zoeszköz az adatokat grakonok és nyomkövetések formájában jeleníti meg. A nyomkövetések az X és Y tengelyek értékpárjainak listáját tartalmazzák. Tárolásukra és megjeleníté sükre elemzotáblákat használ. Az Elemzoeszköz a szimulációs eredmények feldolgozására és új nyomkövetések készítésére módszerek széles választékát támogatja. Ebben benne van a hisztogramok, sur uség és kumulatív eloszlásfüggvények, valamint a kondencia interval használatát is a vektor vagy lumok számítása is. Támogatja továbbá a matematikai szur ok elore nyomkövetési adatok feldolgozásához. A matematikai szur ok deniált számításokra, valamint statisztikai és aritmetikai operátorokra alapozott hierarchikus blokkdiagrammok két ábra (5.13. és 5.14.) az Elemzoeszköz által készített ként vannak deniálva. A következo grakonokat szemlélteti. A 5.14. ábrán látható Elemzoeszköz négy grakont jelenít meg egyszerre. Népszeru diszkrét-esemény szimulációs rendszer a COMNET is, melyet majd a 5.9. alfejezetben fogunk röviden tárgyalni.
182
5. Hálózatok szimulációja
grakon) valamint vektor adatok (alsó grakon) grakus megjelení5.13. ábra. Egy példa a skaláris adatok (felso tésére.
5.6.5. Hálózatelemz®k az Alkalmazásjellemz® Kör0nyezet az Egyre nagyobb az érdeklodés az alkalmazás életciklusán keresztüli, a fejlesztéstol üzembe helyezésig tartó teljesítmény-elorejelzésre, mérésre, modellezésre és megállapí tásra. Az alkalmazások teljesítményének elorejelzése különösen fontos olyan alkalmazási területeken, mint amilyen például az elektronikus kereskedelem. Az egyre inkább versengo elektronikus kereskedelemnél az alkalmazás teljesítménye különösen fontos lehet ott, ahol nagyon szoros a verseny. A teljesítmény így a bevételekre is hatással van. Ha egy alkalmazás gyengén teljesít, akkor az alkalmazás helyett inkább mindig a hálózatot hibáztatják. Ezeket a teljesítményproblémákat sokminden okozhatja, például az alkalmazás tervezési hibája vagy a lassú adatbázisszerverek. Az Alkalmazásjellemzo környezethez ( Application Characterization Environment ACE) és a Network Associates Sniffer-jéhez hasonló esz módszertanokat fejleszthetnek ki arra, hogy azonosítani közök használatával a modellezok problémákat. tudják az alkalmazás-lelassulások forrását és megoldják az azokat eloidéz o javaslatokat tehetnek a teljesítmény optimalizáAz alkalmazás elemzése után a modellezok lehetnek. lására, aminek eredményei gyorsabb alkalmazások és jobb válaszidok környezet a hálózati alkalmazások szemléltetésére, elemzésére Az Alkalmazásjellemzo és alkalmazásfejlesztoi a és hibáinak elhárítására alkalmas eszköz. A hálózatok szervezoi következokre használhatják.
•
Hálózatok és alkalmazások szuk keresztmetszetének meghatározására.
•
Hálózati és alkalmazásproblémák felderítésére.
5.6. Szimulációs modellezo rendszerek
183
Elemzoeszköz. 5.14. ábra. Négy grakont megjeleníto
•
alkalmazások válaszidejeire gyakorolt haVárható hálózati módosításoknak a meglévo tásának elemzésére.
•
Az alkalmazásoknak változó kongurációk és hálózati feltételek melletti teljesítményé nek elorejelzésére.
határozzák meg, melyeket különbözo Egy alkalmazás teljesítményét a hálózat jellemzoi lista néhány ilyen tulajdonságot és a kapcsolódó komponensek befolyásolnak. A következo hálózatelemeket tartalmazza:
•
Hálózati közeg
ingadozás) Sávszélesség (torlódás, eros
alkalmazások) Késleltetés (TCP ablakméret, nagy késleltetésu eszközök, csevego
•
Csomópontok
•
Kliensek
•
A felhasználók számára szükséges ido
Feldolgozási ido
Kiéheztetés
Kiszolgálók
184
•
5. Hálózatok szimulációja
Feldolgozási ido
Többrétegu várakozó adatok
Kiéheztetés
Alkalmazások
alkalmazások) Alkalmazás-fordulók (túl sok forduló csevego
Szálak (egy és többszálúság)
Adat prol (erosen ingadozó, túl sok adatfeldolgozás)
Az alkalmazások elemzése két fázist igényel:
•
Az alkalmazás futása közben csomag-nyomkövetések készítése ahhoz, hogy egy alapkongurációs modellt készíthessünk az alkalmazás modellezéséhez. Ehhez használhat eszközeit. Ezek a nyomkövetések strajuk az ACE vagy bármely más hálózatelemzok el. tégiailag telepített ügynök-alkalmazásokkal készíthetok
•
A nyomkövetés-állomány importálásával az alkalmazás tranzakcióinak ábrázolása, amit alkalmazásfeladatnak nevezünk, az alkalmazás által generált üzenetek és protokoll adategységek további elemzése céljára. muveleteket Az alkalmazásfeladat elkészítése után a következo végezhetjük el a forga-
lom nyomkövetési eredményein:
•
A csomag-nyomkövetés eredményeinek megjelenítése és szerkesztése a protokoll szintjein, külön ablakokban. Ezeket az ablakokat arra is használverem különbözo részeit. Így a hatjuk, hogy eltávolítsuk vagy töröljük az alkalmazásfeladat különbözo tranzakciókra tudjuk fordítani a legnagyobb gyelmet. minket érdeklo
•
Alkalmazási szintbeli elemzés elvégzése a szuk keresztmetszetek felismerésére. Külön egyes összetevoit, megmérhetjük a válaszido mint például az alkalmazási szinten eltöl a feldolgozási idot és a hálózati adattovábbítás idejét, továbbá részletes statisztött idot, tikákat tekinthetünk meg a hálózatról és az alkalmazásról. A csomag-nyomkövetések eredményei alapján elemezhetjük a hálózati és alkalmazásprotokollok adategységeit is.
•
módosítási ötletek és tervezett Az alkalmazás teljesítményének elorejelzése különbözo változtatások esetén. A következokben a részletekbe bocsátkozás nélkül illusztráljuk egy egyszeru három-
rétegu alkalmazáson keresztül az elobb említettek jellemzoit. Egy távoli alkalmazásszer kliens (ami adatbázis szervertol igényel információkat) esetén szeretnénk verhez hozzáféro okait. A kliens egy ADSL vonalon csatlakozik az Intermeghatározni a nagy válaszido netre, az alkalmazásszerver és az adatbázis szerver között pedig egy 100 Mbps sebességu okát, valamint megoldási leEthernet kapcsolat van. Azonosítani akarjuk a nagy válaszido hetoségeket szeretnénk ajánlani. Ehhez nyomkövetési ügynököket telepítünk a kliens és az alkalmazásszerver valamint a két szerver közé. Az ügynökök egyidejuleg mindkét helyen gyujtik az információkat a tranzakciók alatt. Ezután a nyomkövetési információk egyesíthe és szinkronizálhatók, hogy ezáltal a hálózat és az egyes rétegek késleltetésének a leheto tok legjobb elemzési lehetoségét tudják nyújtani. A nyomkövetési információknak az ACE-ba való importálása után a tranzakciókat az Adatcsere diagramon ( Data Exchange Chart) elemezzük, ami ábrázolja az alkalmazás üzeneteinek a rétegek közötti továbbítását (lásd a 19.4. ábrát).
5.6. Szimulációs modellezo rendszerek
185
5.15. ábra. Adatcsere diagram. Az ábra színes változata megtalálható a 808. oldalon.
méAz Adatcsere diagram megmutatja a kliens és a szerverek között átvitt különbözo Függoségek megjelenítése jelölonégyzet bejelölése esetén fehér vonalak jelzik a nagy feldolgozási kés-
retu csomagokat. A tranzakció teljes válaszideje körülbelül 6 másodperc. A
leltetéseket az alkalmazásszerver és a kliens rétegeknél. További elemzés céljára készíttethetünk egy
Késleltetések összegzése ablakot, melyben az alkalmazás válaszideje a követ négy általános kategóriára van osztva: az alkalmazás késleltetése, terjedési késleltekezo tés, átviteli késleltetés és protokoll/torlódás miatti késleltetés (lásd az 5.17. ábrát). Ennek a diagramnak a segítségével meggyelhetjük az alkalmazáshoz és a hálózathoz kapcsolódó késleltetések viszonyát a kliens és a szerverek közötti tranzakció alatt. Látható, hogy az alkalmazás késleltetése jóval több, mint a terjedési, átviteli és a protokoll/torlódás miatti késleltetés. A Diagnózis funkció (5.17. ábra) a lehetséges szuk keresztmetszeteknek egy sokkal elemzésével, melyek gyakran részletesebb elemzési lehetoségét biztosítja olyan tényezok okoznak teljesítményproblémákat a hálózati alkalmazásokban. Az egy adott küszöb feletti értékek szuk keresztmetszetként, vagy lehetséges szuk keresztmetszetként vannak megjelölve. A tranzakció diagnózisa igazolja, hogy az elsodleges szuk keresztmetszet az alkalmazásszerver feldolgozási késleltetése miatt van. A feldolgozási késleltetést lassú állomány input/output, CPU feldolgozás vagy memóriahozzáférés okozhatja. Az elemzés egy má sik szuk keresztmetszetet is felfed, ami az alkalmazás csevegossége. Ez tehát a követ feladatunk. Az alkalmazás viselkedését az alkalmazás-fordulókkal kapcsolatban vizskezo gáljuk, amihez a tranzakció-statisztikákból juthatunk hozzá. Egy alkalmazás-forduló az alkalmazás-üzenetfolyam irányának megváltozását jelenti. A tranzakció statisztikáiból (5.18. ábra) kiderül, hogy az alkalmazás-fordulók száma alkalnagy, azaz a tranzakció által egy idoben küldött adatok mérete kicsi. Ez jelentos
186
5. Hálózatok szimulációja
5.16. ábra. Késleltetések összegzése. Az ábra színes változata a 808. oldalon látható.
5.17. ábra. Diagnózis ablak.
mazásbeli és hálózati késleltetéseket okozhat. Továbbá, az alkalmazás feldolgozási idejé része telhet el a sok kérés és válasz feldolgozásával. A Diagnózis ablak egy nek jelentos Csevegosség szuk keresztmetszetet jelez Csevegosség hálózati költsége szuk kereszt metszet nélkül, ami a következoket jelenti:
5.6. Szimulációs modellezo rendszerek
187
5.18. ábra. Statisztikák ablak.
•
hálózati forgalmat a csevegosség Az alkalmazás nem generál jelentos miatt.
•
feldolgozási késleltetést okoz a sok kis alkalmazási szintbeli Az alkalmazás jelentos kérés és válasz kezelése miatt.
•
Csevegosség hálózati költsége drasztikusan nohet egy nagyobb kés leltetésu hálózatban.
Az alkalmazás
Azt lehet ajánlani, hogy az alkalmazásnak kevesebb és nagyobb üzeneteket kellene kül denie. Ezzel hatékonyabban használná ki a rétegek és a hálózat eroforrásait. Például, egy adatbázis alkalmazásnak nem szabad egy rekordhalmazt rekordonként egyesével elküldenie. akkor, ha nagyobb sávszélességet adnánk (??. Vajon jelentosen csökkenne-e a válaszido ábra) a kliens és az alkalmazásszerver közötti kapcsolathoz? Ennek a kérdésnek a megválaszolása azért fontos, mert a nagyobb sávszélesség sokba kerül. A becslés funkciót fel diagramon a sávszélességet 128 használva megválaszolhatjuk ezt a kérdést. A következo jaKbps-ról 10 Mbps-ra növeltük. Látható, hogy körülbelül 827 Kbps után nincs jelentos vulás a válaszidoben, azaz az ajánlott legnagyobb sávszélesség ennél az alkalmazásnál nem nagyobb, mint 827 Kbps, ami pedig biztosítható egy nagyobb sebességu DSL vonallal is. Az alkalmazás teljesítményének elemzése után a forgalom nyomkövetési adataiból azonnal el tudjuk készíteni az induló alapkongurációs modellt további szimulációs célokra, amit a 5.20. ábra szemléltet.
188
5. Hálózatok szimulációja
5.19. ábra. A sávszélesség hozzáadásának hatása a válaszidore. Az ábra színes változata a 809. oldalon látható.
5.20. ábra. Alapkongurációs modell további szimulációs tanulmányokra.
5.6.6. Sniffer a Network Associates cég Sniffer nevu Egy másik népszeru hálózatelemzo terméke. (A Net work Associates ezt nemrég nevezte át Netasyst-re.) Ez egy hatékony hálózatmegjeleníto feladatok megoldását teszi lehetové: eszköz, ami a következo
•
nyomkövetését. A hálózati forgalom részletes elemzés céljára történo
5.7. Modellfejlesztési életciklus
•
189
Az
•
Expert Analyzer segítségével problémák diagnosztizálását. A hálózati tevékenységek valós ideju meggyelését.
•
Részletes kihasználtság és hibastatisztikák gyujtését az egyes állomásokról, párbeszé vagy a hálózat bármely részérol. dekrol
•
A korábbi kihasználtság és hibainformációk mentését alapkongurációs elemzésre.
•
Látható és hallható riasztások létrehozását, továbbá a hálózat adminisztrátorainak értesítését problémák észlelése esetén.
•
A hálózat aktív eszközökkel való vizsgálatát forgalomszimulációs célokra, válaszido mérésre, hop-ok számlálására és problémák elhárítására.
5.7. Modellfejlesztési életciklus 5.7.1. Egy keretrendszer hálózatmodellez®k számára A hálózatmodellezésnek számos megközelítése van. Egy lehetséges módszer egy modell készítése a hálózati topológia alapján a hálózati forgalom statisztikai közelítésével. Néhány meg tudja vizsgálni néhány paraméter változtatásának a hálózat módosítás után a modellezo vagy az alkalmazás teljesítményére gyakorolt hatását. Ennél a megközelítésnél fontosabb a teljesítménykülönbségek vizsgálata annál, hogy egy olyan modellt használjunk, ami valós hálózati forgalmon alapszik. Például, bizonyos kliens-szerver tranzakciókat feltételezve változását a kapcsolat-kihasználtság függvényében. Ebben meg akarjuk mérni a válaszido az esetben nem különösebben fontos, hogy egy a valódi hálózati forgalmon alapuló mo által becsült adatdellt alkalmazzunk. Elég megadni egy gyakori felhasználó vagy tervezo forgalom mennyiségét, majd ezen adatmennyiség esetén vizsgáljuk meg, hogy a válaszido amikor a kapcsolat-kihasználtság növekszik az eredetihez képest. mennyivel no, o hálózatszerveA hálózatmodellezés leggyakrabban használt megközelítése a megeloz zés módszertanát követi. Ez magában foglalja az valós hálózati forgalmon alapuló hálózati modell készítését a hálózat jelenlegi és a jövobeni viselkedésének szimulálására és az új és szimulációs eszköalkalmazások hozzáadásának hatásainak elorejelzésére. A modellezo változtatni tudnak a modellen, új berendezéséket, zök alkalmazásával a hálózatszervezok munkaállomásokat, kiszolgálókat és alkalmazásokat adhatnak hozzá. Ezen kívül az egyes kapcsolatokat nagyobb sebességuekre cserélhetik, és tesztelhetik oket a hálózat tényleges megváltoztatása elott. A következokben ezt az egyetemek, vállalatok és az ipar által szé bekezdésekben a modelllesköruen elfogadott megközelítési módot követjük. A következo fejlesztési életciklusnak nevezett modellezési lépéseket tekintjük át, amelyeket már több nagyméretu vállalati hálózat modellezésében alkalmaztunk. A modellfejlesztési életciklus lépésekbol áll: tehát a következo
•
A hálózat topológiájának és komponenseinek azonosítása.
•
Adatgyujtés.
•
Az alapkongurációs modell elkészítése és érvényesítése, és ennek felhasználásával szimulációs tanulmányok végzése.
•
Az alkalmazásmodell elkészítése az alkalmazások által generált forgalom részleteinek felhasználásával.
190 •
5. Hálózatok szimulációja
Az alapkongurációs és az alkalmazásmodell integrációja valamint a szimulációs tanulmányok befejezése.
•
További adatgyujtés a hálózat növekedése és változásai után, továbbá miután további részleteket tudtunk meg az alkalmazásokról.
•
Ezeknek a lépéseknek a megismétlése. A következokben a fenti lépéseket részletezzük:
A hálózat topológiájának és komponenseinek azonosítása A topológia a hálózat zikai komponenseit (forgalomirányítók, áramkörök és kiszolgálók) és ezek kapcsolatát írja le. Tartalmazza az egyes hálózati berendezések helyét és kongurációjuk leírását, azt hogy milyen típusú és sebességu áramkörökkel vannak összekapcsolva, a LAN-ok és WAN-ok típusát, a kiszolgálók helyét, a címzési módokat, az alkalmazások és protokollok listáját stb. Adatgyujtés Az alapkongurációs modell felépítéséhez szükség van a topológia és forgalom adataira. a topológia jellemzoit A modellezok megadhatják manuálisan, vagy pedig hálózatmene eszközök és a hálózati berendezések kongurációs állományainak felhasználásával. dzselo eszköz használja az Egyszeru Számos hálózatmenedzselo hálózati menedzsment protokollt ( Simple Network Management Protocol SNMP), mellyel a forgalomirányítókban és más berendezésekben futó SNMP ügynökök által karbantartott Menedzsment információs adatbázisból ( Management Information Base MIB) lehet lekérdezni. Ezt a folyamatot nevezik SNMP hálózat-feltérképezésnek. A kérdéses hálózat topológiájának felméréséhez topológia-adatokat importálhatunk a forgalomirányítók kongurációs állományaiból. Egyes eszközök hálózatmenedzsment platformok (például HP OpenView teljesítménymenedzselo vagy IBM NetView) térkép állományaiból is tudnak adatokat importálni. Ezek exportálási funkcióját alkalmazva a kapott térkép fájl importálható lesz a modellezéshez. forrásokból Az alapkongurációs modellhez szükséges forgalmi adatok különbözo származhatnak: interjúkból és hálózati dokumentumokból származó forgalomleírásokból, és hálózatetervezési vagy karbantartási dokumentumokból, MIB/SNMP jelentésekbol vagy Távoli meggyelo lemzo ( Remote Monitoring RMON) nyomkövetési eredmé Az RMON egy hálózatmenedzselo protokoll, ami lehetové nyekbol. teszi a hálózati információk gyujtését az egyes csomópontokban. Az RMON nyomkövetési eredményeit RMON szintjein szondák gyujtik, melyek szabványuktól függoen a hálózati architektúra különbözo gyujtik az adatokat. A 5.21. ábra a leggyakrabban használt szabványokat és adatgyujtési szinteket foglalja össze. A hálózati forgalom osztályozható használat és alkalmazás alapú adatokként. A legfontosabb különbség a két osztály között az, hogy milyen fokú részleteket biztosítanak az adatok, valamint hogy milyen következtetések vonhatók le belolük. A felosztás egyértelmuen megadható két egymás melletti OSI réteg, a szállítási és a viszonyréteg segítségével. A használat alapú adatok a szállítási réteggel kapcsolatos teljesítménykérdésekkel kapcsolatos vizsgálatokra szolgálnak, az alkalmazás alapú adatok pedig a hálózati architektúra szállítási rétege fölötti rétegekkel kapcsolatos elemzésekre. (Intenet terminológiában ez ekvivalens a TCP szint és az e fölötti alkalmazási szint közötti vágással.)
191
5.7. Modellfejlesztési életciklus
RMON1
RMON2
Ethernet/Token Ring
X
X
Enterprise RMON X
MAC réteg meggyelése
X
X
X
hálózati réteg meggyelése
X
X
alkalmazási réteg meggyelése
X
X
kapcsolt LAN, Frame Relay, ATM
X
VLAN támogatása
X
alkalmazás válaszideje
X
5.21. ábra. Az RMON szabványok összehasonlítása.
A használat alapú adatok gyujtésének célja a teljes forgalom méretének meghatározása megvalósítása elott. az alkalmazásoknak a hálózaton történo Ezek az adatok a forgalomirá SNMP ügynököktol gyujthet össze. nyítókban vagy egyéb hálózati berendezésekben lévo ok A forgalomirányítókhoz vagy kapcsolókhoz küldött SNMP kérdések statisztikákat biztosítanak az egyes LAN interfészeken, WAN áramkörökön vagy permanens virtuális áramkör ( Permanent Virtual Circuit PVC) interfészeken keresztül küldött bájtok pontos számá sávszélesség ról. Ezen adatok segítségével kiszámíthatjuk az egyes áramkörökön elérheto kihasználtságát. Az alkalmazás alapú adatok gyujtésének célja pedig az egy alkalmazás által generált adatok mennyiségének és az alkalmazás igényeinek a típusának meghatározása. Ez lehe számára az alkalmazás viselkedésének megértését és az alkalmazási tové teszi a modellezok RMON2 kompatibilis szondákból, a szintbeli forgalom jellemzését. A forgalomelemzokb ol, vagy a NETScout Manager-bol származó adatok különbözo részleteket biztosítaSniffer-bol berendezések nak az alkalmazás hálózati forgalmáról. A stratégiailag elhelyezett adatgyujt o elég adatot tudnak gyujteni ahhoz, hogy világosan lássuk az alkalmazás forgalmának visel tipikusan a következo alkalmazási szintbeli adatokat gyujtik: kedését. A forgalomelemzok
•
Az alkalmazások típusait.
•
hosztokat. A hálózati rétegbeli címmel (azaz IP címmel) rendelkezo
•
Két hoszt közötti hálózati párbeszédek hosszát (a kezdés és a befejezés idopontja).
•
Az egyes párbeszédek során mindkét irányban az elküldött bájtok számát.
•
A párbeszédek során mindkét irányban a csomagok átlagos méretét.
•
ingadozását. A forgalom eros
•
Csomaghossz eloszlásokat.
•
Csomag-beérkezési idoköz eloszlásokat.
•
Csomagtovábbítási protokollokat.
•
Forgalom prolt, azaz üzenet és csomag méreteket, beérkezési idoközöket és feldolgozási késleltetést.
•
Egy alkalmazásnak egy tipikus felhasználó általi használatának gyakoriságát.
•
csomópontok fontosabb kölcsönhatásait, események sorozatait. A résztvevo
192
5. Hálózatok szimulációja
Az alapkongurációs modell elkészítése és érvényesítése, és ennek felhasználásával szimulációs tanulmányok végzése Az alapkongurációs modell készítésének célja az, hogy a vizsgált hálózat pontos modelljét adjuk meg. Ez a modell a hálózat jelenlegi állapotát tükrözi. A tanulmányok pedig az ezen a modellen elvégzett módosítások hatásait mérik fel. A modell könnyen érvényesítheto, ugyanis az elorejelzéseinek összhangban kell lenniük az aktuális hálózaton végzett méré teljesítmény-mértékeket sekkel. Az alapkongurációs modell általában csak olyan alapveto mint az eroforrás jelez elo, kihasználtság és a válaszido. Az alapkongurációs modell a topológiának és a korábban összegyujtött használat alapú forgalomadatoknak az egyesítésével jön létre. Ezt érvényesíteni kell az aktuális hálózat teljesítmény-paramétereivel, azaz igazolni kell, hogy a modell a valós hálózati mu ködéshez hasonlóan muködik. Az alapkongurációs modell használható az aktuális hálózat elemzésére, és szolgálhat a további alkalmazás és kapacitástervek alapjául is. A modellezo az életciklus adateszközök importálási funkcióját alkalmazva a modellkészítés kezdheto hálózatmegyujtési lépésében összegyujtött topológiaadatok importálásával. A különbözo rendszerek, mint például a HP OpenView vagy a Network Associate Sniffer-je, a nedzselo topológia adatait általában topológia-állományokban (.top vagy .csv) tárolják. A forgaloma datokat tartalmazó állományok a következoképpen csoportosíthatók:
•
Párbeszédek résztvevoinek kommunikációjával kapcsolatos állományok, melyek összegyujtve tartalmazzák a hálózat terheltségének információit, a hosztneveket, a küldött csomagok és bájtok számát az egyes hosztpárok esetén. Az adatok lehetové teszik a modellezoeszköz számára, hogy megtartsa a forgalom erosen ingadozó voltát. Ezek az adatgyujt eszközök segítségével nyerhetok. állományok különbözo o
•
Esemény-nyomkövetési állományok, melyek összegzett információk helyett az egyes tartalmaznak információkat. A szipárbeszédekhez kapcsolódó hálózatterheltségérol eseményre lejátszhatók a hálózati tevémuláció során az állomány alapján eseményrol kenységek. a modellezonek szimulációs paraméterekkel kapcsolatA szimuláció elott a következo
ban kell döntenie:
•
Futási ido. A futási idonek nagyobbnak kell lennie, mint a leghosszabb üzenetnek a alatt a szimulációnak elegendo számú eseményt kell hálózatban való késése. Ezen ido létrehoznia, hogy a modell elég mintát tudjon generálni minden eseménybol.
•
ami a csoFelmelegedési periódus. A szimuláció felmelegedési periódusa az az ido, egyéb elemeinek inimagok, pufferek, üzenetsorok, áramkörök és a modell különbözo cializálásához kell. A felmelegedési periódus megegyezik egy tipikus üzenet hosztok közötti késleltetésével. A szimuláció felmelegedési ideje azért szükséges, hogy bizto sítsuk az egyensúlyi állapot elérését az adatgyujtés megkezdése elott.
•
Többszöri ismétlések. Olyan esetekben, amikor a statisztikák nem eléggé közelítik a valós értékeket, szükség lehet egy adott modell többszöri lefuttatára is. Szintén több szöri ismétlésekre van szükség az érvényesítés elott, amikor több másolatot futtatunk le azért, hogy meghatározzuk a statisztikáknak a másolatok közötti ingadozását. Ennek okai leggyakrabban a ritka események.
•
Kondenciaintervallum.
A
kondenciaintervallum
segítségével
becsüljük
meg
a
méretét. Ez megad egy becsült értéktartományt, populáció-paraméter valószínusíthet o
5.7. Modellfejlesztési életciklus
193
ami egy adott valószínuséggel tartalmazza a becsült paramétert. A leggyakrabban használt intervallumok a 95% és 99% kondenciaintervallumok, melyek 0.95 és 0.99 valószínuséggel tartalmazzák az adott paramétert. A szimulációban a kondenciaintervallum egy mutatót biztosít a szimulációs eredmények pontosságára nézve. A kevesebb ismétlés szélesebb kondenciaintervallumot és kisebb pontosságot eredményez. Több modellezoeszközben a topológia és forgalomadatokat tartalmazó állományok im portálása után az alapkongurációs modell automatikusan elkészül. Ezt ellenorizni kell a lépések végrehajtásákonstrukciós hibák elkerülése végett, majd érvényesíteni a következo val:
•
Egy elozetes futtatással ellenorizni kell, hogy minden forrás-cél pár jelen van-e a modellben.
•
Egy felmelegedési periódust is tartalmazó hosszabb szimulációval meg kell mérni a küldött és fogadott üzenetek számát és a kapcsolatok kihasználtságát, hogy ezzel igazoljuk méretu a megfelelo forgalommennyiség átvitelét. Az alapkongurációs modell érvényesítése igazolja, hogy a szimuláció ugyanazokat a
teljesítmény-paramétereket szolgáltatja, mint amiket a zikai hálózaton mértünk. Általában hálózatjellemzok mérhetok mind a modellben, mind pedig a zikai hálózatban. a következo
•
Küldött és fogadott csomagok száma.
•
Pufferhasználat.
•
Csomagkésleltetés.
•
Kapcsolat-kihasználtság.
•
Csomópontok CPU kihasználtsága. A kondenciaintervallumok és az egymástól független minták száma befolyásolja azt,
hogy modell és a valós hálózat között milyen szoros egyezés várható. A legtöbb esetben a legjobb, amit várhatunk, egy átfedés a szimulációval elorejelzett értékek és a mért adatok kondenciaintervalluma között. A nagyon szoros egyezés elérése túl sok mintát igényelne a hálózatból, és a szimuláció túl sokszori ismétlését. Az alkalmazásmodell elkészítése az alkalmazások által generált forgalom részleteinek felhasználásával Az alkalmazásmodelleket akkor tanulmányozzák, ha egy hálózati alkalmazásnak a hálózat teljesítményére gyakorolt hatását, vagy pedig ha a hálózatnak az alkalmazás teljesítményére gyakorolt hatását kell kiértékelni. Az alkalmazásmodellek a hálózati csomópontok között az alkalmazás futása alatt generált forgalomról szolgáltatnak részleteket. Az alkalmazásmodellek építésének lépései hasonlóak az alapkongurációs modellnél tárgyaltakhoz:
•
és a felhasználói prolokról. Adatok gyujtése az alkalmazás eseményeirol
•
Az alkalmazás adatainak importálása a szimulációs modellbe manuálisan vagy automatikusan.
•
A modellezési hibák azonosítása és javítása.
•
A modell érvényesítése.
194
5. Hálózatok szimulációja
Az alapkongurációs és az alkalmazási modell integrációja és a szimulációs tanulmányok befejezése lépések Az alkalmazásmodell(ek) és az alapkongurációs modell integrációja a következo szerint történik:
•
Kezdjük a használat alapú adatokból készített alapkongurációs modellel.
•
Az alkalmazáshasználati esetek információit felhasználva (a felhasználók helye, száma, tranzakciók gyakorisága) meghatározzuk, hogy hová és hogyan töltsük be az alkalmazásprolokat az alapkongurációs modellbe.
•
o lépésben generált alkalmazásprolokat az alapkongurációs modellhez adjuk, Az eloz melyek a tanulmányozott alkalmazás által generált forgalmat ábrázolják. lépésekbol áll: A szimulációs tanulmányok befejezése a következo
•
Futtassuk a modellt vagy szimulációt egy modellezési eszköz felhasználásával.
•
Elemezzük az eredményeket: hasonlítsuk össze a cél tranzakciók teljesítmény paramétereit a szimuláció kezdetekor felállított célokkal.
•
hálózatelemek kihasználtságát és teljesítményét, különösen ott Elemezzük a különbözo ahol a célokat nem értük el. eseteket tartalmazzák: A tipikus szimulációs tanulmányok a következo
•
Kapacitáselemzés A kapacitás elemzésekor a hálózat paramétereinek változásait tanulmányozzuk, mint például:
Felhasználók számának és helyének változása.
Hálózatelemek kapacitásának változása.
Hálózati technológiák változása.
érdekelhetik például a különbözo változtatásoknak a következo hálózatA modellezot paraméterekre gyakorolt hatásai:
•
Kapcsolók és forgalomirányítók kihasználtsága.
Kommunikációs kapcsolatok kihasználtsága.
Pufferkihasználtság.
Az újraküldött és az elveszett csomagok száma.
elemzése Válaszido elemzésének köre az üzenet és csomagtovábbítási késleltetések tanulmáA válaszido nyozása:
Alkalmazási és hálózati rétegbeli csomagtovábbítási késleltetés.
Csomag válaszido.
Üzenet/csomag késleltetések.
Az alkalmazás válaszideje.
5.8. A forgalom ingadozásának hatása nagy sebességu hálózatokra
•
195
Alkalmazáselemzés arányának megEgy alkalmazással kapcsolatos tanulmányhoz az alkalmazás válaszido határozása tartozik, relatívan az egyes hálózati komponensek és alkalmazások késleltetéséhez. Az alkalmazások elemzése statisztikákat biztosít a hálózat és az alkalmazások teljesítményjellemzoir ol, beleértve az eloz o alfejezetben tárgyaltakat is. különbözo
További adatgyujtés a hálózat növekedése és változásai után, továbbá miután további részleteket tudtunk meg az alkalmazásokról A következokben bemutatott fázisnak a célja az, hogy elemezze vagy elorejelezze a hálózat teljesítményét az aktuális feltételek és a hálózat terhelésének megváltozása (új alkalmazások, felhasználók vagy hálózati struktúra) esetén:
•
Azonosítsuk a hálózati infrastruktúra azon módosításait, melyek megváltoztatják a há lózati eroforrások kapacitásigényét.
•
Az áttervezés tartalmazhatja a megnövekedett vagy lecsökkent kapacitást, a hálózatelemek áthelyezését vagy a megváltozott kommunikációs technológiát.
•
Módosítsuk a modellt ezeknek a változásoknak megfeleloen.
•
Mérjük fel az alkalmazás fejlesztési vagy telepítési terveknek a hálózatra gyakorolt hatását.
•
Mérjük fel az üzleti feltételek és tervek (pl. új felhasználók, telephelyek hozzáadása) hatását a hálózatra.
•
Használjunk folyamatos mérési technikákat a használati tendenciák, különösen az Internet és intranet használathoz kapcsolódók gyelésére.
5.8. A forgalom ingadozásának hatása nagy sebesség¶ hálózatokra 5.8.1. Bevezetés A helyi hálózati és nagy kiterjedésu hálózati forgalommal kapcsolatos jelenlegi mérések azt bizonyítják, hogy a szélesköruen elterjedt Markov-folyamat modellek nem alkalmazhatók napjaink hálózati forgalmának leírására. Ha a forgalom Markov-folyamat lenne, akkor a ingadozása hosszú ido átlagolása során kiegyenlítodne, forgalom eros ami ellentétes a for galom meggyelt jellemzoivel. A valós fogalommal kapcsolatos mérések azt is bizonyítják, ingadozása nagyon gyakran jelen van. A gyakran vagy mindig ero hogy a forgalom eros az önhasonlóság fogalmának felhaszsen ingadozó forgalom statisztikailag jellemezheto nálásával. Az önhasonlóságot gyakran összekapcsolják fraktálgeometriai objektumokkal, melyek a nagyításuktól függetlenül egyformának látszanak. A sztochasztikus folyamatok, idosorok esetében az önhasonlóság kifejezés a folyamat eloszlására utal, amely azonos ma idointervallumban ingadozásokat rad ha különbözo nézünk. Az önhasonló idosorok jelentos tartalmaznak, bármely idointervallumban kiugróan magas értékek sokaságával. A hálózati mint például a csomagok száma másodpercenként, a bájtok száma forgalom jellemzoi sztochasztikus idosoroknak. másodpercenként vagy a keretek hossza tekinthetok Ezért a
196
5. Hálózatok szimulációja
idosorok forgalom ingadozásának meghatározása megegyezik a megfelelo önhasonlóságának jellemzésével. A hálózati forgalom önhasonlóságával foglalkozó cikkek megmutatják, hogy a csomag teljesen más lesz akkor, ha a szimuláció valós vesztés, a puffer kihasználtság és a válaszido forgalomadatokat vagy az önhasonlóságot is tartalmazó mesterséges adatokat használ. A háttérrol
= 0, 1, 2, . . .) egy stacionárius kovariancia folyamat. Egy h i ilyen folyamatµ = E [Xt ] várható érték konstans, egy σ2 = E (Xt − µ)2 szórásnégyzet és i h = E (Xt − µ)(Xt+k − µ) /E (Xt − µ)2 (k = 0, 1, 2, . . .) autokorrelációs függvény,
Legyen X
= (Xt
: t
hoz tartozik egy egy r(k)
ami csak k-tól függ. Feltételezzük, hogy X-nek van egy
∼ αk−β ,
r(k)
alakú autokorrelációs függvénye, ahol 0 tálja X
(m)
=
(X
(m)
(k)
: k
=
1, 2, 3, m
=
k
→∞
< β < 1 és α 1, 2, 3, . . .) az
(5.1) egy pozitív konstans. Reprezen új idosorokat, melyeket az ere-
blokkok átlagolásával kapunk. Minden deti X sorok feletti m méretu, egymást nem fedo m
= 1, 2, 3, . . . , X (m) -re
egyesített X
(m)
X
(m)
k
=
(Xkm−m+1
+ ··· +
Xkm )/m, (k
≥
1). Továbbá jelölje r
(m)
az
idosorok autokorrelációs függvényeit.
Az önhasonlóság deníciója Az X folyamatot önhasonlónak nevezzük H X megfelelo r
(m)
(k)
(m)
=
1
− β/2
önhasonlósági paraméterrel, ha a
egyesített folyamatnak azonos korrelációs struktúrája van, mint X-nek, azaz
= r(k) minden m = 1, 2, . . .
(k
= 1, 2, 3, . . .) esetén.
Az X stacionárius kovariancia folyamatot aszimptotikusan önhasonlónak nevezzük
− β/2 önhasonlósági ha m → ∞, 0.5 ≤ H ≤ 1. H
=
1
paraméterrel, ha minden eléggé nagy k-ra r
(m)
(k)
→
r(k),
A hosszú távú függoség deníciója Egy stacionárius folyamat hosszú távon függo, ha az autokorrelációs értékek összege végtelenhez tart:
P
k
r(k)
→ ∞. Egyébként a folyamat rövid távon függo. A deníciókból szár-
folyamatoknak exponenciálisan fogyó, addig a maztatható, hogy míg a rövid távon függo folyamatoknak hiperbolikusan fogyó autokorrelációik vannak, azaz a hosszú távon függo eloszlású valószínuségi kapcsolódó eloszlás nehéz farkú. A nehéz farokkal rendelkezo változók nagy valószínuséggel generálnak különösen nagy értékeket. Az önhasonlóság fokát a H vagy Hurst-paraméter fejezi ki. A paraméter a folyamat autokorrelációs függvényének a fogyás sebességét mutatja. Amint H
→ 1, az önhasonlóság
A hosszú távon függo önhasonló folyamatok esetén és a hosszú távú függoség mértéke is no. H
> 0.5.
Forgalommodellek ered. KorábA forgalommodellezés a hagyományos hangátviteli hálózatok modellezésébol ban a modellek legtöbbje azon a feltevésen alapult, hogy a modellezett folyamatok mar koviak (vagy általánosabban rövid távon függok). Azonban napjaink nagy sebességu digi tális csomag-alapú hálózatai a hálózati szolgáltatások és technológiák különbözoségének köszönhetoen sokkal bonyolultabbak és erosebben ingadozók, mint a hagyományos hangforgalom.
5.8. A forgalom ingadozásának hatása nagy sebességu hálózatokra
197
5.22. ábra. Az Internetes hálózati forgalom önhasonló természete.
Válaszul az új fejlesztésekre számos kinomult sztochasztikus modellt hoztak létre, mint például a Markov-modulált Poisson-folyamatok, a uid-ow modellek, a markovi érkezési folyamatok, a kötegelt markovi érkezési-folyamat modellek, a csomagsorozat modellek és a Transzformáció-kiterjesztés-minta ( Transform-Expand-Sample) modellek. Ezek a modellek leginkább a kapcsolódó sorbanállási probléma analitikus megoldására helyezik a hangsúlyt. Általában nem vetik oket össze a forgalom valós jellemzoivel, és nem bizonyít ják, hogy eredményeik összhangban vannak a valós forgalomadatok statisztikai jellemzoivel. A modellek egy másik csoportja megpróbálja követni a valós forgalomadatok statiszti kai jellemzoit. Viszont hosszú ideig a hálózatokkal kapcsolatos kutatások nem rendelkeztek forgalmi mérésekkel. Azonban az utóbbi években nagy mennyiségu megfelelo a Webre és a nagy sebességu hálózatokra vonatkozó mérési adatot gyujtöttek össze és tettek elér hetové. Ezeknek az adatoknak egy része nagy felbontású, órákon, napokon vagy heteken hónapokról, évekrol bizkeresztül mért forgalmi adatokat tartalmaz. Más részük hetekrol, tosít információkat. A nagy felbontású adatok statisztikai elemzései bebizonyították, hogy a csomag-alapú hálózatok valós forgalmi adatai alátámasztják az önhasonlóságot. Ezek az eredmények rámutatnak a tradicionális modellek és a mért forgalmi adatok közötti elté résekre. Míg a hagyományos modellekben a feltételezett folyamatok rövid távon függok, a mért forgalmi adatok bizonyítják a hosszú távú függoséget. A 5.22. ábrán az Internet meg különbözo felhasználószám forgalom és a hangforgalom közötti különbség gyelheto a forgalom egyre egyenletesebb lesz, ellentétben esetén. Amint a hangfolyamok száma no, az Internet-forgalommal. sorbanállási modellekkel ellentétben a hosszútávú függoséggel A rövid távon függo modellekkel kapcsolatban eddig jóval kevesebb elméleti eredmény született. rendelkezo csoportja van: a fraktális Gauss-zajok és a fraktális Az önhasonló modelleknek két fo ARIMA folyamatok. A Gauss-modellek pontosan leírják több forgalomfolyam egyesítését. Az M/Pareto modellt olyan hálózati forgalommodellezésben használták, ahol a Gauss számú egyesített adat. modell alkalmazásához nem állt rendelkezésre elegendo
198
5. Hálózatok szimulációja
Fekete doboz és strukturális modellek A hagyományos idosorok elemzését fekete doboz modellezésnek nevezzük. Ezzel ellentétben a szerkezeti modellezés arra a környezetre összpontosít, amelyben a modell adatait napjaink kommunikágyujtötték, azaz a hálózati komponensek hierarchiájára, melyekbol elismerik, hogy a fekete doboz modellek ciós rendszerei felépülnek. Míg az elobbi szerzok hasznosak lehetnek más környezetekben, a modern csomag-alapú hálózatok dinamikus és bonyolult természetének megértésére alkalmatlannak tartják oket. Ezeknek a modelleknek nem sok haszna van napjaink hálózatainak tervezésében, irányításában és ellenorzésében sem. Hogy az empirikusan meggyelt jelenségeknek, mint amilyen a hosszútávú függoség is, zikai magyarázatát adjuk, a fekete doboz modelleket strukturális modellekre kell cserélnünk. A strukturális forgalommodelleknek egy jól alkalmazható jellemzojük, hogy gyelembe veszik napjaink hálózatainak rétegelt felépítését, és elemezni tudják a hozzájuk kapcsolódó hálózatparamétereket, amelyek alapvetoen meghatározzák a hálózat teljesítmé nyét és muködését. Az idosor-modellek általában ezeket a részleteket fekete dobozokként kezelik. Mivel a valós hálózatok bonyolult rendszerek, a fekete doboz modellek sok esetben feltételezik, hogy pontosan ábrázolják a valós rendszert. A hálózatszámos paraméterrol számára, akik igen fontos alkalmazói a forgalommodellezésnek, a fekete doboz tervezok modellek nem túl hasznosak. Egy bonyolult hálózati környezetben ritkán lehetséges meg számára a mérni vagy megbecsülni a modell nagy számú paraméterét. A hálózattervezok modellnek egyszerunek és értelmesnek kell lennie az adott hálózatra nézve. A modell támaszkodhat valós hálózati mérésekre, és az eredményeknek helytállóknak kell lenniük a valós hálózat teljesítményére és muködésére nézve. Sokáig a forgalommodelleket valódi hálózatokban gyujtött adatok felhasználása nélkül készítették. Ezek a modellek nem voltak alkalmazhatók gyakorlati hálózattervezésre. Nap jainkban a nagy mennyiségu hálózati forgalmi mérések elérhetosége, és a hálózati struktúra bonyolultsága miatt egyre inkább alkalmazzák az Ockham borotvája nevu növekvo elvet. (Ockham borotvája egy középkori lozófus, William Ockham elve volt. Eszerint az elv sze rint a modellezoknek nem szabad a minimálisan szükségesnél több feltételezést tenniük. Ez az alapelv, melyet a takarékosság elvének is hívnak, motiválja az összes tudományos modellezést és elméletépítést. A modellezoknek az adott jelenség leírására alkalmas ekvivalens modellek közül a legegyszerubbet kell választaniuk. Ez az elv bármely modell esetén segíti a modellezoket abban, hogy csak azokat a változókat vegyék be a modellbe, amelyek valóban szükségesek a jelenség magyarázatához. Így a modellek kifejlesztése egyszerubbé válik, csökken az inkonzisztencia, a félreérthetoség és a redundancia lehetosége.) A szerkezeti modellek bemutatják, hogyan magyarázza a forgalom dinamikájának részleteit az egyes hosztok szintjén a hosztok közötti párbeszédek hálózati forgalomának önhasonló természete. A szerkezeti forgalommodelleknek zikai jelentése van az adott hálózati környezetben, és nyomatékosítják a hosszútávú függoség túlsúlyát az egyes hosztok közötti párbeszédek által generált csomag érkezési mintákban. Ezek a modellek betekintést nyújtanak abba, hogy az egyes hálózati kapcsolatok hogyan viselkednek helyi és nagy kiterjedésu hálózatokban. Habár ezek a modellek az összeállított forgalmi minták zikai struktúrájának gyelembevételével túlmennek a fekete doboz modellezési módszertanon, nem tartalmazzák a kapcsolatok, forgalomirányítók, kapcsolók és ezek véges kapacitásainak a forgalmi útvonalakon egybefonódó struktúráját. Crovella és Bestavros megmutatták, hogy a World Wide Web forgalma az önhasonló tulajdonságokat mutat, továbbá hogy a Weben elérheto állományméretek ságéval egyezo
5.8. A forgalom ingadozásának hatása nagy sebességu hálózatokra
199
nehéz farkúak lehetnek. Szintén megmutatták, hogy elsod eloszlása miatt az átviteli idok legesen a felhasználók farkúak lehetnek.
szintén nehéz gondolkodási idejének hatása miatt a csendes idok
ingadozás hatása a nagy sebességu Az eros hálózatokra ingadozásnak a hálózati torlódásokra gyakorolt hatásai a következok: Az eros
•
A veszteségeket is tartalmazó torlódási periódusok meglehetosen hosszúak lehetnek, és erosen koncentráltak.
•
csökkenését. A pufferméret lineáris növekedése nem okozza a csomagvesztés jelentos
•
csomagvesztésAz aktív kapcsolatok számának csekély növekedése is okozhat jelentos növekedést. Az eredmények azt mutatják, hogy a csomagforgalom hullám jellegu. A hegyes csú-
csok okozzák a tényleges adatvesztéseket, a kisebb hullámzások pedig a kiemelkedéseken lovagolnak tovább. ingadozás befolyásolhatja a hálózat teljesítményét, az Egy másik terület, ahol az eros olyan ütemezésu kapcsolat, amely forgalomosztályok közötti prioritásokat tartalmaz. Egy olyan környezetben, ahol a nagyobb prioritású osztályra nincs sávszélességkorlátozás (a zikai sávszélességen kívül), az interaktív forgalom prioritást kaphat a nagy mennyiségu keresztül erosen adatforgalommal szemben. Ha a magasabb prioritású osztály hosszú idon ingadozásai hosszú idore ingadozik, akkor ezen osztály eros akadályozhatják az alacsonyabb prioritású forgalmat. ingadozás olyan hálózatokra is hatással lehet, ahol az engedélyezésvezérlési Az eros mechanizmus nem az egyes kapcsolatok forgalom-paraméterein, hanem a közelmúlt forgalmi mérésein alapszik. Az az engedélyezésvezérlés, amely csak a közelmúlt forgalmát egy hosszú, egészen alacsony forgalmi intenzitású perióveszi gyelembe, félrevezetheto dust követoen.
5.8.2. Modellparaméterek inaktív periódusokból állnak. A kliensek és szerverek közötti tranzakciók aktív és azt követo Ezek a tranzakciók az egyes irányokban küldött csomagok csoportjaiból tevodnek össze. A ingadozásoknak nevezzük. A forgalom erosen csomagcsoportokat eros ingadozó volta a idoparaméterekkel következo jellemezheto:
•
Tranzakció érkezési idoköz ( Transaction Interarrival Time TIAT): Egy adott tranz csomagja és a következo tranzakció elso csomagja között eltelt ido. akció elso
•
ingadozások között Eros ingadozás érkezési idoköz ( Burst Interarrival Time): az eros 1/λ, ahol λ az eros ingadozások beérkezési intenzitása. eltelt ido,
•
ingadozásokban a csoCsomag érkezési idoköz ( Packet Interarrival Time): az eros 1/r, ahol r a csomagok beérkezési intenzitása. magok érkezése között eltelt ido,
A Hurst-paraméter Elore látható, hogy az egyre több és többféle forgalom gyorsan folytatódó többszolgálta tású hálózatokba való egyesítése végül a forgalom kiegyenlítodését fogja eredményezni. az egyesítés mértéke, a folyamat Gauss-folyamatokkal modellezheto. Jelenleg Ha elegendo
200
5. Hálózatok szimulációja
viszont a hálózati forgalom nem mutat a gaussihoz közeli jellemzoket. A hálózatok nagy részében az egyesítés mértéke nem elég nagy ahhoz, hogy kiegyenlítse az erosen ingadozó forgalom negatív hatását. Azonban addig, amíg a forgalom gaussivá nem válik, a létezo módszerek pontos méréseket és elorejelzéseket nyújthatnak az erosen ingadozó forgalomról. A módszerek többsége a Hurst-paraméter becslésén alapszik minél nagyobb a H értéke, annál nagyobb az ingadozás, következésképpen rosszabb a kapcsolók és a forgalomirányítók teljesítménye az egyes forgalmi útvonalak mentén. Egyes módszerek megbízha ol függ, például a becslési technikától, tóbbak másoknál. A megbízhatóság számos tényezot az idointervallumtól, a mintamérettol, a forgalmi politikától stb. A publikált mérések alap1
módszereket . Ezek közül az ján megvizsgáltuk a legkisebb becslési hibával rendelkezo Újraskálázott módosított tartomány ( Rescaled Adjusted Range R/S)) módszert válasz Benoit csomagban. tottuk, mivel ennek megvalósítását megtaláltuk a hálózatról letöltheto Módszerünkhöz az ezen csomag által kiszámított Hurst-paraméter szolgál bemenetként. Az M/Pareto forgalommodell és a Hurst-paraméter ingadozásokat tartalmazó, hosszú Ismert, hogy az M/Pareto modell alkalmas a hosszú eros forgalomfolyamok modellezésére. A modellt eredetileg az ATM pufferszintjeitávon függo nek az elemzésére javasolták, késobb az Ethernet, VBR videó és egykiszolgálós sorbanállási rendszerekben IP csomagfolyamok teljesítményének elorejelzésére is használták. A modellt itt nem csak egykiszolgálós sorra alkalmazzuk, hanem olyan összetett rendszerre, melyben kapcsolatok, kapcsolók és forgalomirányítók befolyásolják az egyes hálózatelemek teljesítményét. Az M/Pareto modell egymást átfedo,
λ
beérkezési intenzitású eros ingadozások
Poisson-folyamata. Az ingadozások r intenzitással generálnak csomagokat. Minden inga egy Pareto-eloszlású ideig folytatódik. A Pareto-eloszlás dozás az intervalluma kezdetétol forgalmat jellemzo nagyon hosszú ingadoalkalmazása eredményezi a hosszú távon függo zásokat. Annak a valószínusége, hogy egy Pareto-eloszlású X valószínuségi változó túllép egy x határt:
γ x δ , x≥δ Pr { X > x} = 1, egyébként, 1 < γ < 2, δ > 0.
ingadozások Az X várható értéke, az eros
(5.2)
µ = δγ/(γ − 1) várható hossza és ennek szó-
rásnégyzete végtelen. Egy t intervallumot feltételezve ebben az intervallumban a csomagok M átlagos száma: M
= λtrδγ/(γ − 1) , és M(γ − 1) λ= . tr δγ
(5.3) (5.4)
Az M/Pareto modell aszimptotikusan önhasonló, és a Hurst-paraméterre teljesül, hogy H
1
=
3
−γ 2
.
(5.5)
Szórásnégyzet, együttes szórásnégyzet, Higuchi, maradék-szórásnégyzet, Újraskálázott módosított tartomány,
Whittle becslés, periodogram, regressziós maradéktag
201
5.8. A forgalom ingadozásának hatása nagy sebességu hálózatokra
eltelt ido
átlagos sávszélesség
összes bájt/
bájtok/ bejövo
bájtok/ kimeno
(másodperc)
kihasználtság %
másodperc
másodperc
másodperc
299
2.1
297.0
159.2
137.8
300
2.2
310.3
157.3
153.0
301
2.1
296.8
164.4
132.4
302
2.7
373.2
204.7
168.5
...
...
...
...
...
5.23. ábra. Nyomkövetési eredmények.
bájtok átlagos
üzenet késés
száma
(milliszekundum)
440.4279
78.687
pufferszint (bájt) 0.04
eldobott csomagok
a kapcsolat sávszélesség kihasználtsága (%) 56 Kbps ATM DS-3 100 Mbps
száma
Frame Relay
szegmens
Ethernet
0
3.14603
0.06
0.0031
5.24. ábra. A mért hálózatjellemzok.
5.8.3. A Hurst-paraméter megvalósítása a COMNET modellez®eszközben A Hurst-paramétert és az M/Pareto modell egy módosított változatát a COMNET diszkrétesemény szimulációs rendszerben valósítottuk meg. A diszkrét-esemény szimuláció segít például a kapcsolatok kiségével valósághu hálózatjellemzoket kaphatunk. Ilyen jellemzo használtsága és a kapcsolók, forgalomirányítók teljesítménye. Módszerünkkel felmérhetjük az összeállított erosen ingadozó forgalom káros következményeit, és elorejelezhetjük hatását a teljes hálózat teljesítményére. Forgalmi mérések Az alapkongurációs modell felépítéséhez egy nagyméretu intézményi hálózatban a Con rendszerrel gyujtöttünk cord Network Health nevu hálózatelemzo össze nyomkövetési in széles és keskeny sávú kapcsolatokon végeztünk méréseket, pélformációkat. Különbözo dául 45 Mbps ATM, 56 Kbps, és 128 Kbps Frame Relay összeköttetéseken. A Concord Network Health rendszer segítségével adott ideig forgalmi méréseket végezhetünk az egyes hálózati csomópontoknál, mint például forgalomirányítóknál, kapcsolóknál. Az idointer vallumot 6000 másodpercre állítottuk be, és a következoket mértük: a küldött és fogadott bájtok és csomagok másodpercenkénti számát, a csomag késleltetést, az eldobott csomagok csomagok számát és az számát stb. A rendszer nem képes mérni az ingadozásokban lévo ingadozások hosszát, mint ahogy azt az elobbi M/Pareto modellben feltételeztük. Emiatt a korlátozás miatt a rendelkezésre álló adatoknak megfeleloen kissé módosítjuk a forgalommodellt. ötpercenként készítünk pillanatfelvételeket a egy keskeny sávú Frame Relay kapcsolat forgalomáról egy távoli kliens és egy intézmény szervere között a 5.23. ábra szerinti formában. A küldött bájtok átlagos számát, az üzenetkésést, a kliens helyi forgalomirányítójának a pufferszintjét, az eldobott csomagok számát, és az 56 Kbps sebességu kapcsolatnak, az ATM hálózat DS-3 szegmensének és a 100 Mbps sebességu Ethernet kapcsolatnak a célál átlagos kihasználtságait a 5.24. ábra foglalja össze. lomásnál lévo A COMNET a tranzakciókat a következokkel reprezentálja: üzenetforrás, cél, üzenet kommunikációs berendezések és kapcsolatok. Az üzeméret, valamint az útvonalon lévo
202
5. Hálózatok szimulációja
netküldési intenzitás egy beérkezési idoköz eloszlással van megadva, azaz az egymást kö csomagok között eltelt idovel. veto Az M/Pareto modellben a Poisson-eloszlás
λ intenzitás-
sal generál ingadozásokat vagy üzeneteket. Ezt az információt a szimulációban úgy adjuk érkezések közötti idointervallum meg, hogy az egymást követo hossza átlagosan 1/λ. Erre a célra az exponenciális eloszlást használjuk. Az exponenciális eloszlásnak a beérkezések közötti idore való alkalmazásával egy Poisson-eloszlás szerinti érkezési mintát fogunk ka az Exp(1/λ) függvénnyel implementáltuk. punk. COMNET-ben a beérkezések közötti idot mintának megfeleloen A modellben a Concord Network Health-ben lévo 1 másodpercnek állítottuk be a beérkezési idoközt, ami megegyezik
λ = 1/másodperc beérkezési intenzitás-
sal. ingadozások Pareto-eloszlású ideig tartanak. MiAz M/Pareto modellben az egyes eros vel a Concord Network Health eszköz nem tudta mérni az ingadozások hosszát, ezért azt feltételezzük, hogy az ingadozást az egy üzenetben küldött vagy fogadott bájtok másod algoritmusa biztosítja, hogy azopercenkénti száma jellemzi. Mivel az ATM cellakezelo alatt legyenek feldolgozva, ezért a hosszabb üzenetek nos hosszúságú üzenetek azonos ido igényelnek. Így azt mondhatjuk, hogy az ingadozások idotarta hosszabb feldolgozási idot mának eloszlása megegyezik az ingadozások méretének eloszlásával. Ezért módosíthatjuk az M/Pareto modellt úgy, hogy a Pareto-eloszlású ingadozás-idotartamot a Pareto-eloszlású ingadozás-mérettel helyettesítjük. Ezután
δ-t
nem az ingadozások átlagos idotartamából,
kapjuk. hanem azok átlagos méretébol COMNET-ben a Pareto-eloszlású ingadozásméretet két paraméterrel deniáljuk, a hely és az alak paraméterekkel. A hely paraméter megfelel (5.2)
δ-jának, az alak pedig a γ-nak,
ami a (5.5) egyenlettel a következoképpen számítható ki:
γ = 3 − 2H.
(5.6)
A Pareto-eloszlásnak végtelen várható értéke és szórása lehet. Ha viszont az alak pa véges lesz. Ha az alak paraméter nagyobb, mint raméter nagyobb, mint 2, akkor mindketto mint 2, akkor a várható érték véges, viszont a szórásnégyzet 1 és kisebb vagy egyenlo, 1-nél, akkor mind a várható érték, mind a végtelen. Továbbá ha ez kisebb vagy egyenlo szórásnégyzet végtelen. a következot kapjuk: A Pareto-eloszlás várható értékébol
δ=
µ · (γ − 1) . γ
(5.7)
A (5.6) és (5.7) összefüggések lehetové teszik az erosen ingadozó forgalom modellezé lépésekben: sét a valós nyomkövetési eredmények alapján a következo a.
felhasználáNyomkövetési adatok gyujtése a Concord Network Health hálózatelemzo sával.
b.
A H Hurst-paraméter kiszámítása a nyomkövetési adatokból a Benoit csomag segítségével.
c.
o A COMNET eszköz exponenciális és Pareto-eloszlásainak felhasználásával, az eloz és az üzenetek méterének elleg kiszámított paraméterekkel az érkezések közötti ido oszlásának megadása.
d.
Forgalomgenerálás a módosított M/Pareto modell szerint, és a hálózat teljesítményjel lemzoinek mérése.
5.8. A forgalom ingadozásának hatása nagy sebességu hálózatokra
203
5.25. ábra. A hálózati topológiának az a része, ahol a méréseket végeztük.
Az elobbi lépesekkel generált forgalom erosen ingadozó olyan H paraméterrel, melyet valós forgalmi adatokból számítottunk ki.
5.8.4. Az alapkonfigurációs modell érvényesítése Az alapkongurációs modellt úgy érvényesítjük, hogy az 56 Kbps sebességu Frame Relay paramétereit összehasonlítjuk a vaés a 6 Mbps sebességu ATM kapcsolatok különbözo segítségével kapott adatokkal. Az lós hálózatról a Concord Network Health hálózatelemzo összes bájtok/másodperc oszlopot vizsgáljuk. A valós for galomnak a Benoit csomag által kiszámított Hurst-paraméter értéke H = 0.55. A hálózat egyszeruség kedvéért csak az
topológiája a 5.25. ábrán látható. Az üzenetforrások ikon egy alhálózatot reprezentál, mely egy token ring hálózatból, áll, mely a Célhálózat alhálózatban lévo egy helyi forgalomirányítóból és egy A kliensbol B kiszolgálónak küld üzeneteket (5.26. ábra). A beérkezési idoköz és az üzenetek mérete az Exp(1) exponenciális és a Par(208.42, 1.9) Pareto függvényekkel van deniálva. A Pareto-eloszlás helyét (208.42) és alakját (1.9) ingadozások átlagos hosszának a (5.7) és (5.7) képletek segítségével számítottuk ki az eros (ez 440 bájt a 5.24. ábra alapján) és a H
= 0.55 paraméternek a behelyettesítésével (5.27.
ábra). nehéz farkú Pareto-eloszlást és a kumulatív eloszlásfüggA 5.28. grakon a megfelelo vényt szemlélteti (Az X tengelyen a bájtok számát ábrázoltuk). reprezentál 56 K információátviteli A Frame Relay ikon egy kerettovábbítási felhot intenzitással ( Committed Information Rate CIR). A Conc forgalomirányító a Frame Relay hálózatot egy 6 Mbps sebességu, változó intenzitásirányítással ( Variable Rate Cont ATM hálózathoz kapcsolja. Ezt a 5.29. és 5.30. ábra szemlélteti. rol VBR) rendelkezo A
Célhálózat jelöli a B kiszolgálót tartalmazó alhálózatot, melyet a 5.31. ábra szem
204
5. Hálózatok szimulációja
5.26. ábra. Az
üzenetforrás távoli kliens.
5.27. ábra. A kliens által küldött üzenetek beérkezési idoköze és mérete.
léltet. A modell eredményei a Frame Relay kapcsolat kihasználtságát tekintve (0.035
∼ 3.5%)
majdnem azonosak a valós mérésekkel (3.1%) (5.32. ábra). Az üzenetek késleltetése szintén nagyon közel van a kliens és a szerver közötti mért értékhez (78 milliszekundum) (5.33. ábra). A 5.34. ábrán látható, hogy a kliens forgalomirányítójának input puffer szintje körülbelül azonos a mért értékkel. Hasonlóan, az ATM hálózat DS-3 kapcsolat-szegmensének és a célhálózat Ethernet kapcsolatának kihasználtsága is jól közelíti a valós hálózat méréseit (5.35. ábra). a modell nyomkövetési eredményeibol, hogy a H Az is meggyelheto
= 0.55
Hurst-
paraméterrel a modell majdnem ugyanolyan erosen ingadozó forgalmat generál, mint a valós hálózat. Továbbá az eldobott csomagok száma a modellben és a méréseknél is nulla. Így tehát van egy olyan kiinduló modellünk, amely jól reprezentálja a valós hálózatot.
5.8. A forgalom ingadozásának hatása nagy sebességu hálózatokra
5.28. ábra. A Pareto-eloszlás 400 bájt várható érték és H
205
= 0.55 Hurst-paraméter esetén. Az ábra színes változata
a 809. oldalon látható.
kapcsolatai. 5.29. ábra. A 6 Mbps sebességu, változó intenzitásirányítású ATM hálózat belso
5.8.5. A forgalom er®s ingadozásának következményei Módszerünk illusztrálására kifejlesztettünk egy COMNET szimulációs modellt a forgalom ingadozásának a hálózati kapcsolatokra, az üzenetek késleltetésére, a forgalomirányíeros tók input pufferere és a nagy számú felhasználótól származó összetett forgalom miatt eldobott csomagok számára gyakorolt következményeinek mérésére. A modell a 5.3. alfeje zetben leírt módon valósítja meg a Hurst-paramétert. Hogy a ritka események is megfelelo számban eloforduljanak, a szimulációt 6000, 16000 és 18000 másodpercig ismételtük. Az eredményt mindegyik esetben nagyon hasonlónak találtuk. Az erosen ingadozó forgalom forrásainak topológiája üzenetforrás alhálózatok az elobbi alapkongurációs modell szerint továbbítják az ingadozási paraméterrel: H = 0.95, H = 0.75 és üzeneteket, azonos mérettel de különbözo Az H
= 0.55. Kezdetben négy alhálózat muködését szimuláltuk, alhálózatonként négy felhasz-
206
5. Hálózatok szimulációja
5.30. ábra. A 6 Mbps sebességu ATM kapcsolat jellemzoi.
5.31. ábra. A
Célhálózat alhálózat.
oekkel nálóval, melyek mindegyike az eloz megegyezoen ugyanolyan mennyiségu adatot küldött (átlagosan 440 bájtot másodpercenként) (5.36. ábra). Kapcsolat-kihasználtság és üzenetkésleltetés Eloször is egy Frame Relay kapcsolaton szeretnénk mérni és illusztrálni a különösen magas kihasználtság és üzenetkésleltetés csúcsokat. A modell forgalmát adó üzenetek méretét
5.8. A forgalom ingadozásának hatása nagy sebességu hálózatokra
5.32. ábra. A Frame Relay kapcsolat kihasználtsága az alapkongurációs modellben.
5.33. ábra. Az üzenetek késleltetése a kliens és a szerver között.
5.34. ábra. A távoli forgalomirányító input puffer szintje.
207
208
5. Hálózatok szimulációja
5.35. ábra. A DS-3 kapcsolat és a célhálózat Ethernet kapcsolatának kihasználtsága.
Hurst-paraméterekkel. 5.36. ábra. Erosen ingadozó forgalom forrásainak topológiája különbözo
azonos méretu üzenetek
H
= 0.55
H
= 0.75
H
= 0.95
átlagérték
0.12
0.13
0.13
0.14
csúcsérték
0.18
0.48
1
1
5.37. ábra. A szimulált kapcsolat-kihasználtságok átlagos és csúcsértékei.
Hurst-paraméterek határozzák meg. Az üzenetek az összehasonlíthatóság érdekülönbözo kében azonos méretuek. A COMNET eszköznek van egy nyomkövetési opciója is, mellyel adatokat tud gyujteni a modell által generált forgalomról. Azt is ellenoriztük, hogy a kü Hurst-paraméterek esetén generált forgalomfolyamokból a Benoit-csomag hasonló lönbözo Hurst-paramétereket számít ki. A 5.37. ábrán az egyes szimulált esetek kapcsolat-kihasználtságainak átlagos és csúcsértékei láthatók. A kihasználtságok nem százalékban, hanem [0,1] intervallumbeli értékekként vannak kifejezve. alfejezetben található ábrák jól láthatóvá teszik, hogy annak ellenére hogy A következo
209
5.8. A forgalom ingadozásának hatása nagy sebességu hálózatokra
azonos méretu üzenetek
H
= 0.55
H
= 0.75
H
= 0.95
(ms) átlagos válaszido
75.960
65.61
87.880
311.553
csúcsérték (ms) válaszido
110.06
3510.9
32418.7
112458.08
0.470
75.471
716.080
4341.24
standard eltérés
és eros ingadozás. 5.38. ábra. Válaszido
azonos méretu üzenetek elfogadott csomagok blokkolt csomagok
átlagos pufferhasználat bájtokban
13282
H
= 0.55
12038
H
= 0.75
12068
H
= 0.95
12622
1687
3146
3369
7250
56000858
61001835
62058222
763510495
ingadozás közötti kapcsolat. 5.39. ábra. Az eldobott cellák száma és az eros
a kapcsolat átlagos kihasználtsága közel azonos, a csúcsértékek gyakorisága és mérete nö vekszik az ingadozás erosödésével, ez pedig cellavesztéseket okoz a forgalomirányítókban és a kapcsolókban. A válaszidore a 5.38. ábrán látható eredményeket kaptuk. Hurst-paraméterek és a Az A függelék grakonjai grakusan illusztrálják a különbözo közötti kapcsolatot. válaszidok Az input pufferek szintje nagy számú felhasználó esetén Megmértük az erosen ingadozó cellaforgalom miatt az ATM hálózat egy forgalomirányítójának input pufferénél eldobott cellák számát is. Körülbelül 600 felhasználó összegzett forgalmát szimuláltuk, melyek a valós forgalmi mérésekkel egyezoen ugyanannyi bájtot küldtek el másodpercenként. Az 5.39. ábra a blokkolt csomagok számát foglalja össze az egyes eseteknél.
5.8.6. Következtetések oekben Az eloz egy diszkrét-esemény szimulációs módszert mutattunk be, amely alkalmas erosen különbözo ingadozó forgalmat továbbító hálózatok jellemzoinek mérésére. Korábbi tanulmányok bebizonyították, hogy az erosen ingadozó adatfolyamok egyesítése szintén erosen ingadozó adatfolyamot eredményez. Ezért a hagyományos, hálózattervezésre használt módszerek és modellek módosítására van szükség. A mi módszertanunkat a fekete doboz modellek helyett a strukturált modellek csoportjába soroljuk. A strukturális modellek arra a környezetre összpontosítanak, amiben a modellek adatai össze lettek gyujtve, napjaink kommunikációs rendszeazaz a hálózati komponensek hierarchiájára, melyekbol rei felépülnek. Habár a fekete doboz modellek hasznosak lehetnek más környezetekben, nem olyan könnyu oket alkalmazni napjaink hálózatainak tervezésében, irányításában és el lenorzésében. Egy jól ismert modellt, az M/Pareto modellt implementáltuk a COMNET diszkrét-esemény szimulációs csomag felhasználásával. Ez lehetové teszi az önhasonló forgalom káros következményeinek elemzését nem csak egy egykiszolgálós sorra, hanem kapcsolódó hálózati komponensek összteljesítményére nézve is. Valós hálózati különbözo nyomkövetési információk felhasználásával olyan modellt készítettünk és érvényesítettünk, mellyel mérni és grakusan illusztrálni tudtuk az erosen ingadozó forgalomnak a kapcsolatok kihasználtságra, az üzenetkésleltetésekre és a pufferek teljesítményére gyakorolt hatását ingadozás nagyon Frame Relay and ATM hálózatokban. Megmutattuk, hogy az erosöd o és sok eldobott csomagot eredményez, továbbá nagy kapcsolat-kihasználtságot, válaszidot
210
5. Hálózatok szimulációja
5.40. ábra. A Frame Relay link kihasználtsága azonos méretu üzenetek esetén.
teljesítményjellemzoket. szimulációval meghatároztunk különbözo A csomagválasztás hangsúlyozza olyan eszközöknek a szükségességét, melyek haszno és mérnökök számára sak lehetnek nem csak elméleti szakemberek, hanem hálózattervezok jól ismert elméleti eredmények és ezeknek a mindennapi gyakorlati is. Ez a cikk a meglévo, hálózatelemzésben és modellezésben való alkalmazása közötti rést szeretné csökkenteni. meggyelo és irányító eszközökben rendelkezésre állnáMeglehetosen jó volna, ha a méro, forgalommodellek. Az itt tárgyalt modell segítheti a forgalommodellezés nak a megfelelo elsodleges felhasználóit, a hálózattervezoket és mérnököket abban, hogy megértsék a háló zati forgalom dinamikus természetét, továbbá támogathatja oket mindennapi munkájukban.
5.9. Mérési adatok bemutatása 5.9.1. Kapcsolat-kihasználtsági mérések Hurst-paraméterek esetén az átAz 5.405.42. ábrák azt szemléltetik, hogy bár a különbözo lagos kapcsolat-kihasználtságok majdnem azonosak, az ingadozás növekedésével a csúcsér ez pedig a forgalomirányítókban és kapcsolókban cellavesztékek gyakorisága és mérete no, téseket okoz. A kihasználtságok nem százalékban, hanem [0,1] intervallumbeli értékekként vannak kifejezve.
5.9.2. Üzenetkésleltetési mérések Hurst-paraméterek és a válaszidok A 5.435.45. ábrák a különbözo közötti kapcsolatot szemléltetik.
Gyakorlatok fogalmakhoz kapcsolódó tulajdonságot, ese5.9-1. Nevezzünk meg néhány, a következo ményt, tevékenységet és állapotváltozót:
•
Kiszolgáló
•
Kliens
•
Ethernet
211
5.9. Mérési adatok bemutatása
5.41. ábra. A Frame Relay link kihasználtsága H
= 0.75 Hurst-paraméter esetén (magasabb csúcsokkal).
5.42. ábra. A Frame Relay link kihasználtsága H
= 0.95 Hurst-paraméter esetén (sok magas csúccsal).
5.43. ábra. Üzenetkésleltetés azonos méretu üzenetek esetén.
• • •
Csomagkapcsolt hálózat Híváslétesítés celluláris mobil hálózatban A TCP lassú indulás algoritmusa
5.9-2. Olvassunk el egy cikket a hálózatok szimulációjának alkalmazásáról, és írjunk beszámolót arról, hogyan közelíti meg a cikk a modell érvényesítést.
212
5. Hálózatok szimulációja
5.44. ábra. Üzenetkésleltetés H
5.45. ábra. Üzenetkésleltetés H
= 0.55 esetén (magasabb válaszido csúcsokkal).
= 0.95 esetén (nagyon magas válaszido csúccsal).
szoftver 5.9-3. Ez a gyakorlat feltételezi, hogy rendelkezésre áll valamilyen hálózatelemzo (például Lananalyzer for Windows vagy bármilyen más eszköz), mely elemezni tudja a há lózati forgalmat és információkat tud gyujteni róla. A következokben mi az elobb említett eszközt használjuk.
•
Kezdjük el egy állomány továbbítását a helyi hálózatban egy kliens és egy kiszolgáló között. Figyeljük meg a részletes statisztikákat az adatátviteli vonal kihasználtságáról és grakonokat. a másodpercenként átvitt csomagok számáról, majd mentse el a megfelelo
•
A Lananalyzer Help menüjénél válasszuk ki és olvassuk el a Packets fejezetet.
Capturing and Analyzing
•
Az állomány átvitele során csak a kliens és a kiszolgáló közötti csomagokat vizsgáljuk.
•
Mentsük el a csomagokról gyujtött nyomkövetési információkat .csv formátumban. felhasználásával. Figyeljük meg, vannakElemezzük ezt az állományt táblázatkezelo e szokatlan protokoll-események, mint például a csomagok között eltelt túl hosszú ido, túl sok hibás csomag stb.
hálózatelemzési és alapkonguráció ké5.9-4. Ebben a gyakorlatban a Sniffer különbözo tevékenysészítési funkcióit vizsgáljuk. Az alapkonguráció deniálja a hálózatot jellemzo muködést. geket, és ennek ismeretében fel tudjuk ismerni a tipikustól eltéro Ezt okozhatja
5.9. Mérési adatok bemutatása
213
valamilyen probléma, vagy a hálózat növekedése is. Az alapkongurációs adatokat akkor kell gyujteni, amikor a hálózati muködése tipikusnak mondható. Egyes statisztikák készítéséhez, mint például a sávszélesség-kihasználtság vagy a csomagok száma másodpercenként, egy olyan grakont kell készíteni, amely egy adott idointervallumban ábrázolja az informá ciókat. Erre azért van szükség, mert az olyan mintavétel, amely túl rövid idointervallumban lehet. Egy vagy több hálózatkomponens hozzáadása után érdegyujt adatokat, félrevezeto mes egy alapkongurációt készíteni, így késobb össze lehet hasonlítani a hozzáadás elotti és utáni tevékenységeket. Az összegyujtött adatok exportálhatók más programok, például táb és modellezoeszközök lázatkezelok számára, amelyekkel további elemzéseket készíthetünk és amelyek segítik az összegyujtött adatok kezelését. eszköz. Számos jól integrált funkA Sniffer egy nagyon jól alkalmazható hálózatelemzo ciót tartalmaz, melyeket a következokre használhatunk:
• • • •
Forgalomnyomkövetési információk gyujtése részletes elemzés céljára. Problémák megállapítására az Expert Analyzer alkalmazásával. A hálózati tevékenységeknek valós ideju meggyelésére. Részletes kihasználtsági és hibastatisztikák gyujtésére az egyes állomásokról, párbeszé vagy a hálózat bármely részérol. dekrol
•
A korábbi kihasználtsági és hibainformációknak alapkongurációs elemzés céljára tör tárolására. téno
•
látható és hallható riasztások létProblémák esetén az adminisztrátorokat gyelmezteto rehozására.
•
forgalomszimulációs vizsgálatára, válaszido méA hálózat aktív eszközökkel történo résre, hop számlálásra és hibaelhárításra.
•
A Monitor menü History Samples pontja lehetové teszi a hálózati tevékenységeknek egy idointervallumon keresztül való rögzítését. Ezek az adatok használhatók az alapkonguráció elkészítéséhez, ami segíti az egyes határértékek beállítását, melyeknek a muködés átlépése kiváltja az egyes riasztásokat. Tonormálistól eltéro esetén törtno vábbá ezek az adatok szintén hasznosak a hálózat terhelésének a hosszú távú változá sainak meghatározására, így tervezhetové válnak a jövobeli hálózatbovítések.
•
meg vele. Egy adott tevéEgyidejuleg legfeljebb 10 hálózati tevékenység gyelheto kenység meggyelésére több statisztikakészítés is elindítható, így egyidejuleg mind a rövid, mind a hosszú távú tendenciák rögzíthetok. A korábbi minták meggyelérése rendelkezésre álló hálózati események az Adapter párbeszédablakban kiválasztott függenek. Például, egy token ring hálózat esetén a különbözo token ring keadaptertol meg, Frame Relay hálózat rettípusok mintái (mint például a beacon keretek) gyelhetok
214
5. Hálózatok szimulációja
Frame Relay kerettípusok (például LMI keretek) mintái. A esetén pedig a különbözo események adapterenként változnak. meggyelheto Gyakorlati feladatok:
•
(Capture/Dene lter) a saját PC-je és valamelyik távoli munÁllítsunk be egy szur ot kaállomás között az IP forgalom mintavételezésére.
•
Állítsuk be a Monitor/History Samples/Multiple History-nál a következoket: Octets/s (Oktet/másodperc), Utilization (Kihasználtság), Packets/s (Csomag/másodperc), Collision/s (Ütközés/másodperc), és Broadcasts/s (Üzenetszórás/másodperc).
•
Állítsuk be a mintavételi intervallumot 1 másodpercre (jobb klikk a Multiple ikonon és ott properties, Sample).
• •
Indítsuk el a hálózat meggyelését (jobb klikk a Multiple ikonon, majd Start Sample). Szimuláljunk valamilyen szokásos hálózati forgalmat, például töltsünk le egy nagyméretu állományt egy kiszolgálótól.
•
Rögzítsük a
•
Állítsuk a Tools/Options/MAC/Threshold-nál az oktet/másodperc értékét az alapkon-
Multiple History-t ezalatt a szokásos hálózati forgalom alatt. Ezt te kintjük az alapkongurációnak. gurációs érték 10-szeresére(???). Deniáljunk egy riasztást az oktet/másodpercre: Amikor eléri ezt a határértéket, küldessünk egy levelet a saját elektronikus címünkre. Az 5.46. ábrán azt feltételezzük, hogy ez a határérték 1000.
• • • •
A riasztást a 5.47. ábrán látható módon adjuk meg. Ezután állítsuk be az SMTP kiszolgálót a helyi, saját levelezoszerverére (5.48. ábra). A probléma komolyságát (Severity) állítsuk kritikusra (Critical) (5.49. ábra). Gyujtsünk nyomkövetési információkat a forgalomról (Capture/Start) az állomány letöltése alatt.
•
A letöltés befejezodése után állítsuk le az információgyujtést (Capture/Stop majd Display).
• •
Az Expert Decode opcióval elemezzük a csomagok TCP/IP rétegeit! Nézzük meg, megérkezett-e a Sniffer Pro-tól a
riasztás e-mail. Várhatóan az alábbi hoz hasonló levelet fogjuk kapni, mely jelzi az oktet/másodperc határérték túllépését:
From: ... Subject: Octets/s: current value = 22086, High Threshold = 9000 To: ... This event occurred on ... állományokat: Mentse el a következo
• • •
A
Baseline screens-t A Baseline Multiple History.csv állományt A
riasztás e-mail-t
5.9-5. A gyakorlat célja egy alapkongurációs modell felépítése és érvényesítése egy há eszköz felhasználásával. Feltételezzük, hogy a modellezo számára elérheto lózatmodellezo
215
5.9. Mérési adatok bemutatása
5.46. ábra. Beállítások.
egy szimulációs modellezoeszköz, például a COMNET vagy az OPNET. statisztikákat egy távoli számítógép pingelésével. A ping Eloször gyujtsünk válaszido egy kiszolgálóhoz küldött csomagok oda-vissza útparancs a hálózaton egy adott klienstol ping hosztnév -n x -l jának idejét méri. A parancs egy lehetséges formátuma a következo:
> fájlnév. Itt x a küldendo csomagok száma, y a csomaghossz bájtokban, z az idotúllépési érték és a fájlnév az állomány neve, amibe az összegyujtött statisztikák kerülnek. y -w z
Például, a ping 138.87.169.13 -n 5 -l 64
> c:
állományt hozza létre: ping.txt parancs a következo
Pinging 138.87.169.13 with 64 bytes of data: Reply from 138.87.169.13: bytes=64 time=178ms Reply from 138.87.169.13: bytes=64 time=133ms Reply from 138.87.169.13: bytes=64 time=130ms Reply from 138.87.169.13: bytes=64 time=127ms Reply from 138.87.169.13: bytes=64 time=127ms
•
TTL=124 TTL=124 TTL=124 TTL=124 TTL=124
felhasználásával készítsünk egy hisztogramot ezekrol az idokr ol és Egy táblázatkezelo a csomagok sorszámáról.
216
5. Hálózatok szimulációja
5.47. ábra. Új riasztás akció.
5.48. ábra. Levelezési információk.
217
5.9. Mérési adatok bemutatása
5.49. ábra. Beállítások.
•
ol. Készítsünk hisztogramot a válaszok számáról és a válaszidokr
•
kumulatív sur Készítsük el a válaszidok uségfüggvényét, az eloszlás farkánál a részleteket is feltüntetve.
•
o Készítsük el az átvitelek alapkongurációs modelljét. A forgalomjellemzoket az eloz lépésben készített kumulatív sur uségfüggvény határozzuk meg.
•
Érvényesítsük a modellt.
•
Mennyi a kapcsolat kihasználtsága 32 és 64 bájt hosszúságú üzenetek esetén?
számára elérheto egy szimulációs modellezoesz 5.9-6. Feltételezzük, hogy a modellezo köz, mint például a COMNET, OPNET stb. Ebben a gyakorlatban néhány gyakran hasz nált kép-állomány helyét szeretnénk meghatározni egy laborban. Az elorejelzések szerint évben az új kliensek hozzáadása megháromszorozza ezeknek az állományoka következo nak a használatát. Ezek tárolhatók vagy a kiszolgálón, vagy a kliens munkaállomásokon. A könnyebb karbantartás miatt a kiszolgálón való tárolást részesítjük elonyben. Az aktuális hálózatnak egy alapkongurációs modelljét fogjuk elkészíteni, és megmérjük a kapcsolatkihasználtságot az állományátvitelek alatt. Továbbá érvényesítjük a modellt az aktuális for galomjellemzokkel. A forgalom skálázásával elorejelezhetjük a kapcsolat-kihasználtságot a munkaállomások hozzáadása után megháromszorozódott forgalom esetén.
•
Készítsük el az alapkongurációs modell topológiáját.
•
Gyujtsünk forgalom-nyomkövetési információkat az átvitel alatt, és importáljuk oket.
218 •
5. Hálózatok szimulációja
Futtassuk és érvényesítsük a modellt (Az átvitt üzenetek számának a modellben meg számmal, a szimuláció ideje egyenkell egyeznie a nyomkövetési állományban lévo ( Interpacket Time) - összegével, és a lonek kell lennie a csomagok közötti idok kapcsolat-kihasználtságnak közel egyenlonek kell lennie a nyomkövetés alatti átlagos kihasználtsággal).
•
Írassuk ki az átvitt üzenetek számáról, az üzenetkésleltetésrol, a protokollok általi
• •
Háromszorozzuk meg a forgalmat.
kapcsolat-kihasználtságról és a teljes kapcsolat-kihasználtságról szóló jelentéseket.
Írassuk ki az átvitt üzenetek számáról, az üzenetkésleltetésrol, a protokollok általi kapcsolat-kihasználtságról és a teljes kapcsolat-kihasználtságról szóló jelentéseket.
•
Ha a kapcsolat-kihasználtság az alapkongurációs határérték alatt van, akkor a kiszol gálón hagyjuk a kép-állományokat, egyébként a munkaállomásokra helyezzük át oket.
•
Kérdés: Hol érdemesebb tárolni ezeket, a klienseken vagy a kiszolgálón?
5.9-7.
Ennek a gyakorlatnak a célja az osztott és a kapcsolt Ethernet teljesítményének
összehasonlítása. Megmutatjuk, hogy az örökség ( legacy) vagy osztott Ethernet átala kítása kapcsolt Ethernetté csak akkor indokolt, ha az ütközések száma meghalad egy adott határértéket. a) Készítsük el egy osztott Ethernetet használó helyi hálózati kliens/szerver alkalmazás modelljét. A modell tartalmaz egy 10Base5 Ethernetet, mely egy kiszolgálót (Webszerver) és három számítógépcsoportot kapcsol össze (Kliens 1, Kliens 2, Kliens 3). Minden csoportnak három számítógép a tagja, továbbá minden csoportnak van egy
Web Request Web Server alkalmazása válaszol. Minden Web Request forgalmat generál a kiszolgálóhoz. Amikor a kiszolgáló megkap egy Web Request üzenetet, olyankor egy Web Response üzenetet generál és kliensnek. elküldi a megfelelo nevu üzeneteket generáló forrása. A kiszolgálónak ezekre egy
•
Minden
•
A Webszerver visszaküld egy üzenetet
Web Request egy 10000 byte hosszú üzenetet jelent, amit a forrás min den Exp(5) másodpercben küld a Webszerverhez. Állítsa az üzenet szövegét Web Request-re. Web Response szöveggel. Az üzenet mérete 10000 és 100000 bájt között változik, ezt a Geo(10000, 100000) eloszlás határozza meg. A szerver csak a kapott
Web Request üzenetekre válaszol. Állítsa a válaszüze Web Response-ra. A többi paraméternél használjuk az alapértelmezett értékeket. netet
• • • • •
Válasszuk
a Csatornakihasználtságot ( Channel Utilization) és az Ütközési statisztikák-at ( Collision Stats) a Kapcsolatok beszámolói-nál ( Links Reports). Válasszuk az Üzenetkésleltetés-t az Üzenet + válaszjelentés-nél ( Message + Res ponse Source Report). Futtassuk a szimulációt 100 másodpercig. Megadhatjuk az animáció opciót is. Kapcsolat-kihasználtság-ot és az Ütközési statisztikák-at megjeleníto szóló jelentést. jelentést, valamint a forgalom forrásai közötti üzenetkésleltetésrol
Írassuk ki a
csökkentése érdekében alakítsuk át az osztott LAN-t kapcsolt LAN-ná. b) A válaszido A kliens-szerver paramétereket és az Ethernet sebességét változatlanul hagyva helyezzünk
5.9. Mérési adatok bemutatása
219
el egy Ethernet kapcsolót a kliensek és a szerver közé. (A szerver egy full-duplex 10Base5 kapcsolattal csatlakozik a kapcsolóhoz.)
•
Kapcsolat-kihasználtság-ot és az Ütközési statisztikák-at megjeleníto szóló jelentést. jelentést, valamint a forgalom forrásai közötti üzenetkésleltetésrol
Írassuk ki a
c) Mindkét modellben cseréljük a 10Base5 kapcsolatokat 10 BaseT kapcsolatokra. Ek o esetekkel ellentétben nem azonos mértéku kor az eloz relatív javulást fogunk tapasztalni a válaszidoben. Magyarázzuk meg, miért. 5.9-8.
egy-egy Egy vállalat helyi hálózatának egy része két alhálózatból áll. Mindketto
osztályt szolgál ki. Az egyik hálózat az IEEE 802.3 CSMA/CD 10BaseT Ethernet szabvány szerint üzemel, a másik pedig az IEEE 802.5 16Mbps Token Ring szabvány szerint. A két hálózat egy Cisco 2500-as forgalomirányítóval van összekapcsolva. Az Ethernet LAN 10 számítógépet tartalmaz, melyek közül egy e-mail szervernek van kijelölve mindkét osztály számára. A token ring LAN szintén 10 számítógépet tartalmaz, melyek közül egy fájlszervernek van kijelölve az osztályok számára. A vállalat jelenleg mindkét osztályra alkalmazottak felvételét tervezi. Habár a jelenlegi hálózati konguráció valószínuleg nem lesz képes kiszolgálni az új alkalmazottakat, a vállalatnak nincs semmilyen módszere a hálózat kihasználtságának vagy a késleltetésének szeretné felmérni ezeket az aktuális mérésére. A vállalat az új alkalmazottak felvétele elott alapkongurációs szinteket. Az alkalmazottak egyébként is már mindkét osztályról panasz való letöltés lassúsága miatt. kodtak a fájlszervertol A LAN-okon keresztülfolyó közös forgalomnak egy felmérése szerint a forgalom több forrásokból származik: elektronikus levelezésbol, a különbözo alkalmasége a következo és a hang alapú levelezési rendszerbol, amely lehetové zások állomány-átvitelébol teszi a számára, hogy hallható üzeneteket küldjenek az osztályukon dolgozó alkalmazotvezetok statisztikai leírásának alapjául az alkalmazottakkal folytatott taknak. Az üzenetjellemzok beszélgetések és az üzenetek átlagos méretének becslése szolgált. Az elektronikus levelezést minden alkalmazott használja mindkét osztályon. Az inter júkból kiderült, hogy a levélküldések idoköze leírható egy 900 másodperc várható értéku exponenciális eloszlással. A levelek mérete pedig leírható egy olyan egyenletes eloszlással, mely szerint a levélméret 500 és 2000 bájt között van. Az összes e-mail az Ethernet hálóza e-mail szerverhez továbbítódik, ahol pedig a megfelelo felhasználó postaókjában ton lévo kerül tárolásra. kell leHa egy felhasználó el akar olvasni egy levelet, akkor azt az e-mail szervertol kérnie. A postaók ellenorzéseinek ideje leírható egy Poisson-eloszlással, melynek várható értéke 900 másodperc. Az erre használt üzeneteknek a mérete 60 bájt. Ha egy felhasználó le szeretne tölteni egy levelet, akkor a szerver beolvassa a felhasználóhoz tartozó állományt és továbbítja a kért levelet az adott alkalmazott számítógépére. Az állomány beolvasásának üzenetek feldolgozásának ideje leírható egy egyenletes eloszlással, mely 3 és a benne lévo és 5 másodperc közötti értékeket vehet fel. A levelek mérete egy normális eloszlással írható le, melynek várható értéke 40000 bájt és standard eltérése 10000 bájt. Mindkét osztályon nyolc alkalmazott van, akiknek saját számítógépe van, és akik a is kérnek le állományokat. Ezeknek a kéréseknek az érkezési idoköze fájlszervertol leírható egy 900 másodperc várható értéku exponenciális eloszlással. A kérések mérete egyenletes eloszlást követ, 10 bájt minimummal és 20 bájt maximummal. Ezeket a kéréseket kizárólag fájlszervernek küldik. Egy kérés érkezésekor a szerver beola token ring hálózatban lévo
220
5. Hálózatok szimulációja
5.50. ábra. Hálózati topológia. Az ábra színes változata a 810. oldalon látható.
vassa a kért állományt és elküldi az adott számítógépnek. Ez a feldolgozás csak nagyon kis késleltetést jelent. Az állományok mérete egy normális eloszlással írható le, melynek várható értéke 200000 bájt és standard eltérése 25000 bájt. használják, akik általában A hang alapú üzenetküldést mindkét osztályon csak a vezetok alkalmazottaknak küldenek ilyen üzeneteket. A továbbító csak a saját részlegükben lévo alkalmazás eloször kapcsolatot létesít az alkalmazott számítógépével. Ha ez felépült, akkor továbbítja az üzenetet. Ezek mérete normális eloszlással írható le, melynek várható értéke 50000 bájt és standard eltérése 1200 bájt. Beérkezési idoközük szintén normális eloszlással írható le, melynek várható értéke 1000 másodperc és standard eltérése 10 bájt. Az összes üzenetforrás a TCP/IP protokollkészletet használja, és a csomagok elkészítésének becsült ideje 0.01 milliszekundum. A hálózat topológiájának hasonlónak kell lennie a 5.50. ábrán a COMNET-ben láthatóhoz. jelentések használhatók a szimulációnál: A következo
•
Kapcsolatjelentések: Csatorna-kihasználtság és Ütközési statisztikák az egyes kapcsolatok esetén.
•
Csomópontjelentések: A beérkezett üzenetek száma az egyes csomópontok esetén.
•
Üzenet és válasz jelentések: Az üzenetek késleltetése az egyes csomópontok esetén.
•
Session Source jelentések: Az üzenetek késleltetése az egyes csomópontok esetén. fog észlelni a fájlszervernél. Ha a A modell futtatásakor jóval nagyobb válaszidot
igényel, akkor milyen megoldást lehet javaszolgáltatás-minoségi szint kisebb válaszidot solni annak csökkentésére? Jó megoldás lenne még egy fájlszerver üzembe helyezése az
5. Megjegyzések a fejezethez
221
Ethernet hálózatban? Mi mást lehetne még módosítani?
Megjegyzések a fejezethez A hálózaLaw és Kelton monográája [280] jó áttekintést ad a hálózati rendszerekrol. tok osztályozásával kapcsolatban két, magyarul is megjelent monográát ajánlunk, melyek Sima, Fountain és Kacsuk [432], illetve Tanenbaum [457] szerzoi A valószínuségszámítás alapjaival kapcsolatban Prékopa András [377] és Rényi Alfréd [393] könyveit ajánljuk. A leggyakoribb statisztikai eloszlásokat Banks könyve [29] alapján foglaltuk össze. A sur uségfüggvények ábrázolására használt COMNET szimulációs modellezési eszközt ismertetése megtalálható a CACI két kiadványában [65, 235]. A szimuláció matematikai hátterével kapcsolatban Kátai Imre jegyzetét [244], a sorbanállás elméletével kapcsolatban pedig Kleinrock könyvét [256] és Sztrik János hálózatról tananyagát [452] ajánljuk. letöltheto szótáA csatornakapacitás deníciója megtalálható például az Interneten is elérheto rakban [217, 489]. Az információ- és kódelmélettel kapcsolatos részletek megtalálhatók például Jones és Jones könyvében [234]. A hosszú távú függoséggel foglalkoznak például Taqqu és társai [287, 460]. A hálózatmodellezésben eloforduló leggyakoribb eloszlások becsléseit leíró 5.1. ábra [29] származik. Banks, Carson és Nelson könyvébol a [356]-ben megadott címrol. Az OPNET szoftver és annak dokumentációja letöltheto Ez a dokumentáció részletesen tárgyalja a szimuláció egyes szakaszait is. A forgalom ingadozásának hatását Gyires Tibor cikke [184] alapján elemeztük. számolnak be Leland és társai [285, A hálózati forgalommal kapcsolatos mérésekrol 286], valamint Crovella és Bestavros [94]. Hálózatok önhasonlóságával foglalkoznak Erramilli, Narayan és Willinger [121], Willinger és társai [497], valamint Beran [42]. Mandelbrot [307], Paxson és Floyd [363], vala folyamatokat. mint Mandelbrot és van Ness [308] tanulmányozták a hosszú távon függo muvekben: Forgalomirányítási modellek találhatók például a következo [17, 199, 227, 320, 347, 348, 359, 497]. Forgalmi adatokat tartalmaz [43, 114, 181, 363]. Az 5.22. ábra Listanti és Eramo cik [292] származik. kébol A hosszútávú függoséget elemzi Addie, Zukerman és Neame [3], Duffield és O'Connell [113], valamint Erramilli, Narayan és Willinger [121]. A fekete doboz modellezés kifejezést Willinger és Paxson [495] vezette be 1997-ben. például Francis Heylighen honlapja [206] tartalmaz Az Ockham borotvája nevu elvrol a Network Associates cég honlapján [316] találhatók további részleadatokat. A Snifferrol tek. Willinger, Taqqu, Sherman és Wilson [496] egy szerkezeti modellt elemeznek. Crovella és Bestavros [94] a World Wide Web forgalmát elemezték. ingadozásnak a hálózati torlódásokra gyakorolt hatásával foglakozott például Az eros Neuts [347], valamint Molnár Sándor, Vidács Attila és Nilsson [335]. A Hurst-paraméter hatását elemzi Addie, Zukerman és Neame [3]. a hálózatról [468]. A Benoit-csomag letöltheto A Pareto-modellt vizsgálta Addie, Zukerman és Neame [3].
6. Párhuzamos számítások
1
célja, hogy a feladatokat több processzor A folyamatos szintjén párhuzamos számítások fo segítségével gyorsabban oldjuk meg, mint egy processzoron. Ezek a processzorok tartozhat számítógépekhez, amelyek egy hálózaton kenak egyetlen számítógéphez vagy különbözo resztül kommunikálnak. A párhuzamos végrehajthatósághoz mindkét esetben szükség van arra, hogy a feladatot egyidejuleg megoldható alfeladatokra osszuk. párhuzamos száBár a párhuzamos számítások története korábban kezdodött, az elso mítógépnek a 64 processzort tartalmazó ILLIAC IV-et szokták tekinteni, amely 1972-ben kezdett muködni. A párhuzamos számítógépek a nyolcvan évek végén indultak gyors fejlo párhuzamos számítógépek gyártására. désnek, amikor is több új céget alapítottak különbözo Sajnos abban az idoben nehezen indult el a szoftver fejlesztése és a kifejlesztett szoftver nem volt hordozható. Ezért a párhuzamos számítógépeket csak a tudományos és muszaki élet leginkább számításigényes területein alkalmazták, mivel a piac túl kicsi volt ahhoz, fejlesztési költségeket meg tudja zetni. Ezért számos cég abba is hagyta a hogy a jelentos fejlesztést. A dolog pozitív oldala volt az a felismerés, hogy olcsó párhuzamos számítógépek hozhatók létre az elterjedt személyi számítógépek vagy munkaállomások összekapcsolásával. Ahogy a hálózatok gyorsabbá váltak, ezek az úgynevezett klaszterek rövidesen ugyanolyan nagyságrendu sebességet értek el, mint a speciális célú gépek. Jelenleg a világ 500 legnagyobb számítógépének folyamatosan frissített listáján a gépek 42 százaléka klaszter. A párhuzamos számítások eszköztárát gyarapítják azok a multiprocesszoros gépek is, amelyeket ugyan a web és más területek kiszolgálására terveztek, de párhuzamos számítások elvégzésére is alkalmasak. Végül a szoftver hordozhatóságával kapcsolatos problémák is megoldódtak a párhuzamos programozás széles körben elterjesztett szabványai segítségével. A két legfontosabb szabvány az MPI és OpenMP ezeket a 6.3. alfejezetben fogjuk ismertetni. Összegezve, jelenleg elfogadható költségu hardverbázis áll rendelkezésre. A terület azonban még nem érte el fejlodési határait, mivel a párhuzamos szoftver fejlesztése ko egy algoritmust moly nehézségeket okoz. Míg egy soros program megírásához elegendo találni, azaz elemi muveleteknek az adott feladatot megoldó sorozatát, majd az algoritmust egy programozási nyelven leírni, addig a párhuzamos számítások további kihívásokat jelentenek:
1
Párhuzamos számítás több szinten valósítható meg, így utasítás-szinten, szál-szinten és folyamat-szinten. Ez a fejezet elsodlegesen a folyamat szintu párhuzamos feldolgozással foglalkozik. A lektor.
6. Párhuzamos számítások
•
223
Az elemi muveleteket olyan taszkokká kell csoportosítani, melyek párhuzamosan megoldhatók.
•
A taszkokat ütemezni kell a processzorokra.
•
Az adatokat az architektúrától függoen el kell osztani a memóriamodulok között.
•
A folyamatokat és szálakat kezelni kell, azaz elindítani, megállítani és így tovább. A kommunikációt és a szinkronizációt meg kell szervezni. Természetesen nem elég a muveletek csoportosítását, az ütemezést és így tovább meg-
oldani olyan megoldásokat kell találni, amelyek gyors programokhoz vezetnek. A teljesítménymértékeket és a teljesítmény optimalizálásának módszereit a 6.2. alfejezetben tár párhuzamos gyaljuk, ahol a fent említett feladatok megoldását is vizsgáljuk. A különbözo eltéroen algoarchitektúrák és programozási modellek a soros modellektol különbözo ritmusokat részesítenek elonyben. Ennek következtében a párhuzamos algoritmusok bonyolultabbak, mint a sorosak. A párhuzamos algoritmusok vizsgálatához gyakran alkalmaznak egyszerusített modelleket. Például a népszeru PRAM (lásd a 6.4. alfejezetet) modell nem veszi gyelembe a kommunikációs és szinkronizálási költségeket. Hasonlítsuk össze a párhuzamos számításokat az osztott és a konkurens számításokkal. Az osztott számítások összekapcsolt processzorokat használnak és a megoldandó problémá lehetnek. Míg a párhukat kisebb részfeladatokra osztják, de a felosztás céljai különbözok zamos számításoknál a részfeladatok egyidejuleg oldódnak meg, az osztott számításoknál a részfeladatok különbözo helyeken oldódnak meg, különbözo eroforrásokat felhasználva. Ezek a tulajdonságok átfedhetik egymást, ezért számos alkalmazás egyszerre párhuzamos A párhuzamos számításoknál a felépítés homogén, és osztott, a lényeg azonban különbözo. és a focél a számítások gyorsabb elvégzése, az osztott számításoknál a felépítés heterogén a különbözo eroforrások és az alkalmazások számára gyakran kedvezo összekapcsolása. A párhuzamos rendszerek általában hosszabb ideig léteznek és kiszámíthatók, míg az osztott állnak, melyek a futás során kapcsolódtak össze. alkalmazások olyan elemekbol A konkurens számítások nem feltétlenül igényelnek több processzort, és azt a körülményt emelik ki, hogy egyidejuleg több részszámítás van folyamatban. Ez a fontos tulajdon ság garantálja, hogy az eredmény a részszámítások tetszoleges sorrendje és átfedése mellett is helyes lesz. Ezért a párhuzamosság és a konkurencia viszonya ahhoz hasonlítható, hogy egyidejuleg több könyvet olvasunk (ami a gyakorlatban valószínuleg nem oldható meg). Így a konkurens számítás vagy párhuzamos, vagy nem párhuzamos, a párhuzamos számítás viszont mindig konkurens. Egyetlen kivétel az adatok párhuzamossága, melyben egyetlen adatokra. Ezt a megközelítést program utasításait alkalmazzuk párhuzamosan különbözo követi a SIMD architektúra. A nagy sebességnek köszönhetoen a párhuzamos számítások tipikus alkalmazási területei a természettudományok és a muszaki feladatok megoldása, különösen a numerikus számítások és a szimuláció. Ezeknek az alkalmazásoknak egyre nagyobb a számítási igénye, mivel a nagyobb számítási kapacitás részletesebb modellek alkalmazását és így pontosabb eredmények elérését teszi lehetové. A párhuzamos számítások másik elonye a nagyobb me móriakapacitás, ami lehetové teszi, hogy több adatot tároljunk az olyan memóriaszinteken, mint a gyorsítótár. Az 6.1. címu alfejezetben röviden A fejezet további részének felépítése a következo. áttekintjük és osztályozzuk a jelenlegi párhuzamos architektúrákat. Azután a 6.2. alfejezet-
224
6. Párhuzamos számítások
ben olyan alapfogalmakat vezetünk be, mint a taszk és a folyamat, majd elemezzük a hatékonysági mértékeket és a hatékonyság javítására szolgáló általános módszereket. Ezután a 6.3. alfejezet a párhuzamos programozás modelljeit ismerteti, elsosorban a népszeru MPI és OpenMP szabványokra koncentrálva. Erre a gyakorlati alapra épül a fejezet hátralévo része, amely formalizált módon tárgyalja a legegyszerubb párhuzamos algoritmusokat és tervezési módszereket. A soros algoritmusoktól eltéroen a párhuzamos algoritmusok esetén nincs általánosan elfogadott tervezési és elemzési módszer, bár számos modellt javasoltak erre a célra. A modellek mindegyike bizonyos kompromisszumot valósít meg az egymásnak ellentmondó célok nevezetesen a valódi architektúrák pontos tükrözése és a tervezés, a 6.5. valamint elemzés egyszerusége között. A 6.4. alfejezet áttekintést ad a modellekrol, alfejezet pedig konkrét algoritmusokat mutat be többek között a kiválasztás, összefésülés és rendezés feladatok megoldására. Az algoritmusok elemzése során mindvégig nagy gyelmet fordítunk az adott feladat soros és párhuzamos megoldási idejének, valamint a kétféle megoldás során végzett munkának az összehasonlítására. Az algoritmusok elemzésének korszeru felfogását követve nem korlátjával, hanem leelégszünk meg a vizsgált hatékonysági mérték értékének egy felso és a végzett munka hetoleg pontosan jellemezzük a legrosszabb esetben várható futási ido nagyságrendjét.
6.1. Párhuzamos architektúrák A párhuzamos architektúrák egyik egyszeru és közismert osztályozását Flynn javasolta. A számítógépeket négy osztályba sorolta: SISD, SIMD, MISD, és MIMD architektúrák.
•
SI egyszeres utasításáramot (Simple Instruction stream) jelent, azaz egyidejuleg egyetlen utasítás hajtódhat végre.
•
proMI többszörös utasításáramot (Multiple Instruction stream) jelent, azaz különbözo
•
SD egyszeres adatáramot (Simple Data stream) jelent, azaz egyidejuleg egyetlen adattal
utasításokat is végrehajthatnak. cesszorok egyidejuleg különbözo
hajtódhatnak végre muveletek.
•
MD többszörös adatáramot (Multiple Data stream) jelent, azaz egyidejuleg különbözo muveletek. adatokkal is végezhetok
A SISM felépítés a Neumann-elvu számítógépeket jelenti. MISD típusú számítógépeket valószínuleg sohasem építettek. A korai számítógépek SIMD felépítésuek voltak, ma a legtöbb párhuzamos számítógép MIMD felépítésu. Bár ennek a sémának kicsi az osztályozási ereje, mégis széles körben alkalmazzák. osztályozás a párhuzamos gépeket a SIMD, SMP, ccNUMA, nccNUMA, A következo NORMA, clusters, és rács osztályokba sorolja. SIMD architektúrák pro vezérlo Amint azt a 6.1. ábra mutatja, a SIMD számítógép egy nagyteljesítményu áll. A feldolgozó egységeket cesszorból és több, kisebb teljesítményu feldolgozó elembol gyakran rácsszeruen kötik össze úgy, hogy minden egység a közvetlen szomszédaival kom processzor a soros gépek processzorához hasonlóan egymás után olmunikál. A vezérlo
225
6.1. Párhuzamos architektúrák
Vez´erl˝o Egys´eg M P M
P M
P M
P M
P M
P M
P M
P M
P M
P M
P M
P M
P M
P M
P M
P M
6.1. ábra. SIMD architektúra.
vassa és dekódolja az utasításokat. A soros esetben a processzor a beolvasott utasítást a saját adatokkal hajtja végre. A párhuzamos esetben a vezérlo processzor minmemóriájában lévo den feldolgozó egységhez elküldi a beolvasott utasítást és azok egyidejuleg hajtják végre ezt az utasítást a saját memóriájukban tárolt adatokon. Példaként tekintsük az
LD reg, 100 utasí-
tást. Ennek hatására minden processzor betölti a 100-as memóriacím tartalmát a regiszterbe, memóriarekeszt jelent. Tehát a processzorok de a 100-as cím processzoronként különbözo adatokkal. a SIMD felépítésnek megfeleloen azonos utasítást hajtanak végre különbözo Az
if
test
then
if_branch
else
else_branch,
utasítás hatására a processzorok egyidejuleg elvégzik a tesztelést, azután egy részük az if_branch ágon folytatja, míg mások tétlenek maradnak, és végül az elobbiek maradnak tétlenek és az utóbbiak végzik el az else_branch ágat. Emiatt a SIMD felépítésu számítógépek szabályos szerkezetu számítások elvégzésére alkalmasak. Ez a felépítés történetileg lényeges, de ma már nem alkalmazzák. Szimmetrikus multiprocesszorok A szimmetrikus multiprocesszorok (SMP) egy közös memóriához kapcsolódó processzorokat tartalmaznak. A hardver minden processzornak hozzáférést biztosít a szokásos betölt/tárol muveletekkel minden memóriarekeszhez. Ezért a programokat beleértve az operációs rendszert is elég egy példányban tárolni. A memória zikailag modulokra bont azonos minden processzor-modul párra (ez indokolja a szimható, de a hozzáférési ido metrikus jelzot). A processzorokat egy adatátviteli vonal, egy mátrix-kapcsoló vagy egy kapcsolóhálózat köti össze a memóriával (lásd 6.2. ábra). A memóriához való hozzáférés mindegyik esetben késleltetéssel történik, ami részben a hálózati eroforrásokért folyó ver seny következménye, és a processzorok számával no. Minden processzornak egy- vagy többszintes gyors hozzáférésu gyorsítótára is van. A memória és a gyorsítótár között az adatok a gyorsító adatátviteli vonalakon mozognak. Ha fo az egyes adatelemeket több gyorsítótárban is tároljuk, akkor koherenciaproblémák lépnek fel. Például rossz megosztásról beszélünk, ha több processzor is hozzáfér ugyanahhoz a részét használják. gyorsítóvonalhoz, de annak különbözo
226
6. Párhuzamos számítások
P
P
P
P
C
C
C
C
M
M
Busz M
M
6.2. ábra. Busz-alapú SMP-architektúra.
M
M
M
C
C
C
P
P
P
M
···
C P
¨ Osszek¨ ot˝o H´al´ozat
6.3. ábra. ccNUMA architektúra.
Gyorsítótáras NUMA architektúrák
Leopold/Parallel/Fig. 02.07 memóriahozzáférés) nem egységes A ccNUMA (gyorsítótárral koherens nem-egyenletes o osztály szimmetrikus hozzáférésével. A 6.3. memóriahozzáférést jelent, ellentétben az eloz ábra mutatja ezeknek a számítógépeknek a felépítését. Az ábra szerint minden processzorhoz tartozik egy helyi memória (gyorsítótár), amelyhez a hozzáférés gyorsabb, mint a memória további, távoli memóriának nevezett részéhez. /tároló muveletekkel A teljes memóriához szabványos betölto férhetünk hozzá, ezért a programokat az operációs rendszerek programjait is csak egyszer kell tárolni. Az SMP-khez hasonlóan minden processzornak egy vagy többszintes gyorsítótára van; a gyorsítótár szintjeinek összhangját a hardver biztosítja. Gyorsítótár nélküli NUMA architektúrák Az nccNUMA architektúrák abban különböznek a ccNUMA architektúráktól, hogy a hardver csak a helyi memóriából származó adatokat tölti be a gyorsítótárba. A távoli memóri ához való hozzáférés a szokásos beviteli/kiviteli muveletekkel megvalósítható, de eloször lapot a helyi memóriába töltenie. Ez a különbség az operációs rendszernek kell a megfelelo egyszerusíti a hardver tervezését, és ezért az nccNUMA felépítésu gépek több processzort tartalmaznak. Hátrány viszont, hogy az operációs rendszer bonyolultabb, a távoli memóriához való hozzáférés ideje nagyobb. A 6.3. ábrán bemutatott felépítés az nccNUMA típusú számítógépekre is vonatkozik. Távoli memóriához való gyors hozzáférés nélküli architektúrák A NORMA (NO Remote Memory Access Architectures) architektúra abban különbözik az
6.2. Hatékonysági mértékek és optimalizálás
227
o osztálytól, hogy a távoli memóriához lassú beviteli/kiviteli muveletekkel eloz lehet hozzá o osztály betölto /tároló muveleteivel. férni, szemben az eloz Amint azt a 6.3. ábra mutatja, minden csúcs egy processzorból, gyorsító memóriából és helyi memóriából áll, tartalmazza az operációs rendszer egy saját példányát, vagy legalább annak központi részét. Míg az SMP, ccNUMA és nccNUMA architektúrákat rendszerint a közös memóriájú gépekhez sorolják, a NORMA típusú gépeket, klasztereket és grideket az osztott memóriájúakhoz. Klaszterek A klaszter olyan párhuzamos vagy osztott számítógéprendszer, amely egységes felépítésu, áll. A számítógép itt személyi számítógépet, munegymással összekötött számítógépekbol kaállomást vagy egyre gyakrabban szimmetrikus multiprocesszort jelent, azaz olyan hálózati elemet, amely processzorból (vagy processzorokból), memóriából, esetleg perifé áll. Az egységes feldolgozó elemekbol álló rendszert SSI riákból és operációs rendszerbol tulajdonságúnak (Single System Image) mondjuk, ha csak a rendszerbe lehet bejelentkezni, az egyes elemekre nem vagy ha egyetlen fájlrendszer van. Természetesen az SSI tulajdonság fokozatos, ezért a határvonal az osztott rendszerek és klaszterek között nem éles. A NORMA rendszerek és klaszterek közötti határvonal is bizonytalan, mivel attól is függ, eredetileg különálló komponenseket hogy eleve egységes rendszert terveztek vagy meglévo, kapcsoltak össze. A klaszterek osztályozhatók aszerint, hogy párhuzamos számításokra, nagyméretu szá mításokra vagy széles köru hozzáférhetoségre alkalmazzák-e oket. A párhuzamos számításokra használt klaszterek tovább oszthatók a kiemelt klaszterekre, melyeket eleve úgy terveztek, hogy párhuzamos gépekként üzemeljenek, vagy kampus-klaszterekre, amelyek az egy részében párhuzamos gépekként alkalmazott osztott rendszerek. A dedikált klaszteido rek elemei rendszerint nem rendelkeznek perifériákkal és nagy sebességu hálózati vonalakkal vannak összekötve. A kampusz-klaszterek viszont gyakran asztali személyi számítógé kommunikáció közönséges hálózati vonalak segítségével valósul pek, melyek között a belso meg. Gridek A grid egy hardver/szoftver infrastruktúra az eroforrások kö zös használatához és a problémák megoldásához. A gridek lehetové teszik az olyan erofor-
Foster és Kesselman szerint
rásokhoz való összehangolt hozzáférést, mint a processzorok, memóriák, adatok, perifériák stb. A gridek abban különböznek a párhuzamos számítási architektúrától, hogy nagyok, heterogének és dinamikusan változnak. A gridek vezérlése ezért bonyolult feladat.
6.2. Hatékonysági mértékek és optimalizálás Ebben az alfejezetben eloször a gyakorlatban használt hatékonysági mértékeket és optimalizálási módszereket, azután pedig az algoritmusok aszimptotikus elemzésénél felhasználható fogalmakat tekintjük át.
228
6. Párhuzamos számítások
6.2.1. Hatékonyság a gyakorlatban Amint azt a bevezetésben leírtuk, a párhuzamos számítások során a feladatokat taszkokra bontjuk és a taszkokat egymástól függetlenül megoldjuk. A taszkokat folyamatokként vagy programok. szálakként valósítjuk meg. Más szavakkal, a folyamatok végrehajtás alatt lévo Minden folyamattal kapcsolatban tárolunk olyan eroforrásokkal kapcsolatos adatokat, mint a memóriaszegmensek, fájlok és jelek, míg a szálak a folyamatokon belül léteznek és a többszörös szálak megosztják egymás között az eroforrásokat. Adott folyamat szálai hozzáférnek a közös memóriához, míg a folyamatok rendszerint üzenetekkel kommunikálnak. Minden szálnak van egy utasításszámlálója vagy más regiszterértéke, valamint egy verme egya helyi változók tárolására. A folyamatokat tekinthetjük az eroforráshasználatot segíto egységnek. ségnek, míg a szálakat a központi feldolgozó egységen való végrehajtást segíto Mivel kevesebb információ tárolására van szükség, gyorsabban lehet szálakat létrehozni, megszüntetni és egyik szálról a másikra átkapcsolni, mint ugyanezeket a muveleteket folyamatokkal elvégezni. Az architektúrától függ, hogy szálakat vagy folyamatokat alkalmazunk-e. A közös memóriájú gépeken a szálak rendszerint gyorsabban futtathatók, ugyanakkor viszont a folyamatokat felhasználhatjuk a programok hordozhatóságának biztosítására. A szálak alkalmazhatók, ha van egy szoftver réteg (osztott közös memória), amely megvalósítja a közös memória absztrakcióját, de ezeknek a szálaknak nagyobbak a kommunikációs költségei. Míg a taszkok fogalma a problémákhoz kapcsolódik, a folyamatok és szálak fogalma a megvalósításhoz kötodik. Amikor egy algoritmust tervezünk, rendszerint nagyszámú taszkot azonosítunk, amelyek potenciálisan futhatnak párhuzamosan, majd ezek közül többet ugyanarra a folyamatra vagy szálra képezünk le. Párhuzamos programok két stílusban írhatók és ezek a stílusok keveredhetnek: az egyik azaz ugyanazt a muveletet stílusra adatpárhuzamosság jellemzo, egyidejuleg különbözo adatokra alkalmazzuk. Ez a muvelet lehet egy gépi utasítás, mint a SIMD architektúrákban, vagy egy összetett muvelet, például egy függvény alkalmazása. Utóbbi esetben különbözo muveleteket processzorok különbözo hajtanak végre. A másik stílus jellemzoje a taszk taszkokat hajtanak végre. Mivel egy párhuzamosság, azaz a folyamatok/szálak különbözo konstrukcióként tartalmazhat például if vagy case parancsot, az adatpárhufüggvény külso zamosság és taszkpárhuzamosság közti határvonal nem éles. A folyamatok segítségével megvalósított párhuzamos programok tovább osztályozhatók: az SPMD (Single Program Multiple Data) programozási stílus azt jelenti, hogy minden folyamat ugyanazt a programot futtatja, míg az MPMD (Multiple Program Multiple Data) programokat futtatnak. Az MPMD prograstílus alkalmazásakor a folyamatok különbözo mok taszkpárhuzamosak, míg az SPMD programok mind taszkpárhuzamosak, mind pedig adatpárhuzamosak lehetnek. SPMD módban a taszkpárhuzamosságot feltételes utasítások segítségével fejezzük ki. Mivel a párhuzamos számítások elsodleges célja a programok gyors futtatása, a teljesítménymértékek fontos szerepet játszanak ezen a területen. Természetes abszolút mérték de még gyakrabban használnak egy relatív mértéket, a gyorsítást. Adott a végrehajtási ido, problémára a gyorsítást a gyorsítás( p)
= T 1 /T p
hányadossal deniáljuk, ahol T 1 a leggyorsabb ismert soros algoritmus futási ideje p pro függoen cesszoron. A környezettol a gyorsítás vonatkozhat p folyamat vagy p szál alkalma-
229
6.2. Hatékonysági mértékek és optimalizálás
gyors´ıt´as line´aris gyors´ıt´as szuperline´aris gyors´ıt´as tipikus gyors´ıt´as
P 6.4. ábra. Ideális, tipikus és szuperlineáris gyorsítási görbék.
zására is. A gyorsítással kapcsolatos, de ritkábban használt mérték a hatékonyság, melyet a hatékonyság( p)
= gyorsítás( p)/ p
összefüggéssel deniálunk. a deníciótól függetlenül a hatékonyságot a jó teljesítmény szinonimájaként is Ettol használják. A 6.4. ábra bemutatja az ideális, tipikus és szuperlineáris gyorsítási görbéket. Az ideális görbe azt a feltevést tükrözi, hogy ha a processzorok számát megkétszerezzük, akkor a felére csökken. Ezért az ideális gyorsítás egységnyi hatékonyságnak felel végrehajtási ido azaz akkor, ha meg. A szuperlineáris gyorsítás a gyorsításnak köszönhetoen fordulhat elo, a több processzor alkalmazása megnöveli a gyorsítótár méretét, és így több adathozzáférés szolgálható ki a gyorsítótárból ahelyett, hogy a lassú központi memóriához kellene fordulni. A tipikus gyorsítás az ideális gyorsításnál kisebb és csak bizonyos processzorszámig Emellett több processzor alkalmazása lassítja a programot. A tipikus és ideális gyorsítás no. közötti különbségnek több oka van:
•
Amdahl törvénye azt mondja, hogy minden programnak van egy s soros hányada, amely nem párhuzamosítható. Ezért T p
>
s, és így gyorsítás( p)
<
T 1 / s, azaz a gyorsí-
tás mindig kisebb, mint egy konstans érték. Szerencsére egy másik gyakorlati meggyelés, a GustafsonBarsis-törvény csökkenti az Amdahl-törvény gyakorlati szerepét. A Gustafson-Barsis-törvény szerint a tipikus alkalmazásokban a párhuzamos algoritmus alkalmazása nem korlátozódik egy rögzített méretu probléma megoldására, hanem egyre nagyobb méretu feladatokat oldunk meg. Ebben az esetben s lassabban nohet, mint T 1 , és így T 1 / s már nem konstans.
•
A taszkkezelés, azaz a taszkok indítása, megállítása, megszakítása, valamint a folyamatok és szálak ütemezése bizonyos többletterhelést okoz. Továbbá az is rendszerint munkát nem lehet egyenletesen elosztani a folyamatok/szálak igaz, hogy az elvégzendo között.
•
A kommunikáció és a szinkronizáció lassítja a programot. A kommunikáció az adatcserét jelenti, míg a szinkronizáció más típusú koordinációt jelent, például a kölcsönös kizárás biztosítását. A kommunikációs és szinkronizációs költségek még a nagy hálózatokban is nagyságrendileg nagyobbak, mint a sebességu vonalakkal rendelkezo számítási költségek. Ennek oka a zikai átviteli költségek mellett a protokoll számítási többletigénye és a hálózati eroforrásokért való versenyzés okozta késedelem.
230
6. Párhuzamos számítások
hatásának minimalizálásával a teljesítmény javítható. Amdahl törvéA fenti tényezok nyét nehéz megkerülni, kivéve azt az esetet, ha új algoritmust tudunk tervezni, amelyre nézve s értéke kisebb esetleg olyan áron, hogy T 1 értéke nagyobb lesz. Az algoritmikus fogalmakat késobb tekintjük át most a gyakorlatban használt jellemzoket mutatjuk be. Amint korábban láttuk, a taszkokat olyan folyamatokként vagy szálakként valósítjuk meg, amelyek rendszerint többszörös taszkokra vonatkoznak. A nagyobb teljesítmény ér dekében a folyamatok/szálak szemcsézettségét az architektúrának megfeleloen választjuk meg. Sok folyamat/szál szükségtelenül megnöveli a taszkkezelési költségeket, míg kevés folyamat/szál a számítógép alacsony kihasználtságát eredményezi. Ezért célszeru több folyamatot/szálat ugyanahhoz a processzorhoz rendelni, mivel így a processzorok átkapcsolhatnak, amikor bevitel/kivitel vagy más ok miatt várakozniuk kellene. A nagy szemcséju folyamatok/szálak elonye a jobb kommunikáció/számítások arány, míg a nomabb szemcséju folyamatok/szálak alkalmasabbak a terhelés egyenletes elosztására. statikus vagy dinamikus módon. Ha a taszkok futási A terheléskiegyenlítés végezheto akkor a statikus sémákat részesítjük elonyben. ideje elore megbecsülheto, Ezeknél a módszereknél a programozó minden folyamathoz/szálhoz hozzárendel bizonyos számú folyamatot/szálat úgy, hogy az összköltség minden processzoron hasonló nagyságú legyen. A dinamikus megoldásra példa a mester-szolga séma. Ebben a sémában eloször a mester folyamat hozzárendel minden processzorhoz egy folyamatot. Ezután valahányszor egy szolga a mestert és az új taszkot rendel a processzorhoz mindbefejez egy taszkot, értesíti errol addig, amíg minden taszk végre nem hajtódik. Ez a séma jó terheléskiegyenlítést biztosít, aminek az ára a taszkkezelés okozta többletterhelés. A hatékonyság növelésének legjobb eszköze rendszerint a kommunikációs/szink el az architektúra vagy a ronizációs költségek csökkentése. Természetesen javulás érheto adatra rendszerszoftver változtatásával, például a késleltetésnek azaz a távolról érkezo várás idejének csökkentésével, vagy a sávszélesség azaz az idoegység alatt átvitt adatmennyiség növelésével. vagy felhasználói programozó csökkentheti a kommunikáAz algoritmustervezo ciós/szinkronizációs költségeket a beavatkozások számának csökkentésével. Az egyik fontos megközelítés ennek a minimalizálásnak az elvégzésére a helyi optimalizálás. A lokalitás a (soros vagy párhuzamos) programok olyan tulajdonsága, amely tükrözi az azonos ada tokhoz idoben vagy térben koncentrálva való hozzáférés mértékét. Az osztott memóriájú architektúrákban például az adatokat annál a processzornál célszeru tárolni, ahol felhasz náljuk oket. A lokalitás javítható kódtranszformációval, adattranszformációval vagy a ketto programrészlet végrehajtását három prokombinációjával. Például tekintsük a következo cesszoron:
for (i=0; i k/g. Ha van a két szekvenciának
azokat a di, j mátrix elemeket számolja ki, amelyekre (i − j) a határelemek azon de, f
551
13.1. Algoritmusok szekvenciákon
legfeljebb k súlyú illesztése, akkor dn,m esetben dn,m lenkezo
>
≤
k, és dn,m valóban a szekvenciák távolsága, el-
k. Ez utóbbi esetben dn,m nem feltétlenül a szekvenciák távolsága:
hogy van olyan illesztés, amelyre az ezt meghatározó út kilép az |i elképzelheto,
− j| ≤ k/g
egyenlotlenség által deniált sávból, és az illesztés súlya mégis kisebb, mint a meghatározott sávban haladó legkisebb súlyú illesztés. A sarokvágási technikát kiterjesztették olyan többszörös illesztésekre is, ahol egy illesztett k-ast a páronkénti összeg sémával értékelünk, azaz
S Pl
=
k−1 X k X
d( pi,l , p j,l )
,
(13.37)
i=1 j=i+1
ahol S Pl az l-edik illesztett k-as értékelése, d(, ) a
Σ ∪ {−} halmazon deniált távolságfügg-
vény, k az illesztett szekvenciák száma, pi, j pedig a prol i-edik sorának j-edik eleme. Egy szekvencia l-szuffixe az (l
a szekvencia végéig terjedo részstring. Jelöljük + 1)-edik betut ol
wi, j (l, m)-lel az i-edik és a j-edik szekvencia l- illetve m-szuffixének a távolságát. Carillo és Lipman algoritmusa csak azokat a pozíciókat számolja ki, amelyekre
di1 ,i2 ,...in
+
k−1 X k X
j= 1
w j,l (i j , il )
≤t,
(13.38)
l= j
ahol t a teszt érték. Az algoritmus helyességét az bizonyítja, hogy a szekvenciák még nem illesztett szuffixeinek a páronkénti összeg sémával adott optimális illesztésének a súlya nem adódó súlyok összege. A wi, j (l, m)-ek a páronlehet kisebb, mint a páronkénti illesztésbol számíthatók, így az algoritmus a gyakorlat számára elfogadható ido alatt kénti illesztésekbol ki tudja számolni hat darab 200 hosszúságú szekvencia optimális illesztését.
Gyakorlatok 13.1-1. Mutassuk meg, hogy egy n és egy m hosszúságú szekvencia esetén a lehetséges illesztések száma
X
min(n,m)
i=0
+ m − i)! . − i)!(m − i)!i!
(n (n
13.1-2. Adjunk meg egy olyan értékelést és szekvenciák olyan sorozatát, amelyekre az op a szekvenciák hosszával. timális illesztések száma exponenciálisan no 13.1-3. Adjuk meg Hirschberg algoritmusát többszörös szekvenciaillesztésre. függvények esetén. 13.1-4. Adjuk meg Hirschberg algoritmusát affin résbünteto 13.1-5. Adjuk meg a SmithWaterman algoritmust affin résbüntetésekre. 13.1-6. Adjuk meg a Spouge-féle saroklevágási technikát affin résbüntetésekre. levezetett páronkénti illesztése 13.1-7. Két szekvenciának egy többszörös illesztésükbol kivágjuk a többszörös illesztésbol a két szekvenciára vonatkozó sort, ezeket a következo: egymás alá írjuk, majd elhagyjuk a csupa rést tartalmazó sorokat. Adjunk példát három valamelyik két szekvenciára levezetett pászekvencia olyan optimális illesztésére, melybol ronkénti illesztés nem a két szekvencia optimális páronkénti illesztése.
552
13. Bioinformatika
13.2. Algoritmusok fákon algoritmusok gyökereztetett fákon dolgoznak. A dinamikus Az alább ismertetésre kerülo visszavezetéssel történik. Mint látni fogjuk, programozás a gyökereztetett részfákon történo alatt algebrai nem csak optimális eseteket határozhatunk meg, hanem ugyanakkora futási ido kifejezéseket is meghatározhatunk.
13.2.1. A takarékossági elv kis problémája A takarékossági (parszimónia) elv a biológiai szekvenciák változását minél kevesebb számú mutációval akarja leírni. Az alábbiakban csak cserékkel fogunk foglalkozni, azaz adottak hosszú biológiai szekvenciák, és a feladat az, hogy adjuk meg a leszármazási kapegyenlo csolataikat a takarékossági elv alapján. Deniálhatjuk a takarékossági elv kis és nagy problémáját. A nagy problémában ismeretlen az evolúciós törzsfa topológiája, amely mentén a szekvenciák evolválódtak, a feladat ennek a topológiának a megkeresése, valamint ezen egy legtakarékosabb evolúciós történet megkeresése. Az így kapott megoldás tehát nem csak lokálisan az adott topológiára nézve lesz optimális, hanem globálisan is. Megmutatható, hogy a takarékossági elv nagy problémája NP-teljes probléma. A kis problémában adott egy gyökeres fa topológia, és a feladat az, hogy keressünk egy legtakarékosabb evolúciós történetet ezen fa mentén. Az így kapott megoldás lokálisan optimális lesz, de nincs garancia a globális optimumra nézve. A szekvenciák minden egyes pozíciójához egymástól függetlenül kereshetjük meg a legtakarékosabb történetet, így elég azt az esetet megoldani, amikor a fa minden egyes levelén csupán egy karakter van megadva. csúcsaihoz rendelt karakterekkel jellemezEkkor egy evolúciós történetet a fa belso hetünk. Ha két szomszédos csúcson ugyanazt a karaktert látjuk, akkor a takarékossági elv él mentén, egyébként meg egy mutáció alapján nem történt mutáció a két csúcsot összeköto történt. A naiv algoritmus végignézi az összes lehetséges hozzárendelést, ami nyílván lassú, hiszen a lehetséges címkézések száma exponenciálisan növekszik a fa leveleinek számával. visszavezetéssel történik (Sankoff algoA dinamikus programozás a részfákon történo csúcsot, mint györitmusa). Most részfán csak azokat a részfákat értjük, amelyek egy belso keret tartalmaznak, és minden olyan csúcsot, amely az adott gyökér alatt van. Így a részfák csúcsok számával egyezik meg, és ezért egyértelmuen száma pontosan a belso beszélhetünk egy adott pont által deniált részfáról. Feltesszük, hogy egy adott r gyökeru részfa esetén ismerjük r minden t gyerekére és
ω
karakterre azt, hogy a t gyereke által deniált rész-
fán minimum hány mutáció szükséges, ha a t csúcsban számot mt,ω -val. Ekkor mr,ω
=
X t∈ D(r)
min{mt,σ
σ∈Σ
ω karakter található. Jelöljük ezt a
+ δω,σ } ,
(13.39)
ahol a D(r) r gyerekeinek a halmaza, Σ a lehetséges karakterek halmaza, δω,σ pedig 1 ha ω = σ és 0 egyébként. A (13.39) képlet helyessége abból adódik, hogy a megvizsgáltuk az összes lehetoséget arra vonatkozóan, hogy r gyerekeihez milyen karaktereket rendelhetünk, és azt már ismerjük, hogy ezen karakterek hozzárendelésekor legalább mennyi szubsztitúció szükséges az adott gyerek alatti részfán. Az adott fa topológiájához szükséges mutációk száma minω∈Σ mR,ω , ahol R a fa gyö visszafelé haladva a minimális kere. Egy legtakarékosabb evolúciós történetet a gyökérbol értékeket adó karakterek beírásával kaphatunk meg. Ehhez természetesen minden r belso
553
13.2. Algoritmusok fákon
csúcsra és
ω karakterre tárolni kell mr,ω -t.
A minimális mutációk számának meghatározásához a legtakarékosabb történet megkeresése
Θ(n|Σ|2 ) idore van szükség, ezután
vesz igénybe, ahol n a levelek száma. Θ(n|Σ|) idot vesz igénybe, ahol l a szekvenciák Θ(nl|Σ|2 ) idot
A teljes evolúciós történet meghatározása hossza.
13.2.2. Felsenstein algoritmusa adat DNS szekvenciák többszörös illesztése. Csak Felsenstein algoritmusában a bemeno azokat a pozíciókat tekintjük, ahol az illesztésben nincs rés. Feltesszük, hogy az egyes pozíciók egymástól függetlenül evolválódtak, így egy evolúciós folyamat valószínusége az egyes csúcsokon történt események valószínuségeinek a szorzata. Legyen adva egy fa topológiája, amely ábrázolja a szekvenciák leszármazási sorrendjét, valamint egy evolúciós modell, amely minden
σ
karakter
ω-vá
σ-ra, ω-ra és t-re megmondja, hogy mi annak a valószínusége, hogy
alatt. Ezt fσω (t) jelöli. Valamint ismerjük a karakterek evolválódik t ido
egyensúlyi eloszlását, amit
π
jelöl. A kérdés az, hogy mennyi a fa likelihoodja, azaz a fa
valószínusége egy adott paraméterhalmaz mellett. Egy adott paraméterhalmaz mellett a fa likelihoodjának a kiszámítását egy adott fa topológiáján mutatjuk meg (13.1. ábra). Elég azt megmutatni, hogy hogyan kell a likelihoodot egy pozícióra kiszámítani, a fa teljes likelihoodja a pozíciók likelihoodjainak a szorzata. Az adott pozícióra si jelöli az i-edik csúcs karakterét, v j pedig az j-edik él evolúciós ideje, pontosabban a mutációs ráta és az ido pontok állapotait persze általában nem ismerjük, ezért minden lehetséges szorzata. A belso állapotra összegezni kell: L
XXXX
=
πs × 0
s0
s6
× fs
0 s8
s7
(v8 )
f s0 s6 (v6 )
×
f s6 s1 (v1 )
×
f s6 s2 (v2 )
s8
×
f s8 s3 (v3 )
×
f s8 s7 (v7 )
×
f s7 s4 (v4 )
×
f s7 s5 (v5 )
.
(13.40)
Ha négyelemu ábécét, azaz nukleinsav szekvenciákat tételezünk fel, akkor az összegzés 256 n−1
tagból áll, n faj esetén pedig 4
tagból, ami könnyen lehet egy túl nagy szám. Szerencsére,
szorzótényezoket ha az adott változótól nem függo kihozzuk a szumma jel elé, akkor az összegzés felbomlik egy
L
=
X
X πs 0
s0
X ×
f s0 s6 (v6 )[ f s6 s1 (v1 )][ f s6 s2
s6
f s0 s8 (v8 )[ f s8 s3
X (v3 )]
s8
(v2 )]
f s8 s7 (v7 )[ f s7 s4 (v4 )][ f s7 s5
s7
(v5 )]
(13.41)
szorzatra, aminek a számítási igénye jóval kisebb. Vegyük észre, hogy a (13.41) egyenletben és a zárójelezések pontosan leírják a fa topológiáját. Minden összegzés külön elvégezheto, lecsökken ezeket az összegeket szorozzuk össze, így a számítási ido óra, a teljes fa likelihoodjának a kiszámítása
Θ(|Σ|
2
Θ(|Σ|2 n)-re egy pozíci-
nl)-re, ahol l a pozíciók száma.
Gyakorlatok 13.2-1. Adjunk algoritmust a súlyozott takarékossági elv kis problémájára, azaz amikor az egyes változásokat súlyozzuk, és a változások súlyainak az összegét akarjuk minimalizálni.
554
13. Bioinformatika 0
v8 8
v6
v3
6
v1
v7
3
v2
7
v4
v5
4
5
1 2
jelölik. 13.1. ábra. A fa, amin Felsenstein algoritmusát bemutatjuk. Az élekre írt v-k az éleken eltelt evolúciós idot
13.2-2. Az egyes genomok géntartalma különbözik, egy adott faj valamely génje egy másik fajból hiányozhat. A géntartalom változására a legegyszerubb modell az, amelyben két mutációt különböztetünk meg: egy gén törlodik egy genomból vagy egy gén megjelenik a genomban. Adott néhány faj géntartalma, valamint az ezen fajok leszármazását bemutató törzsfa. Adjuk meg azt az evolúciós történetet, amely minimális számú mutációval írja le az adott fajok evolúcióját. 13.2-3. Adott szekvenciákra és törzsfára adjuk meg a Maximum Likelihood evolúciós tör csúcsain azokat a szekvenciákat, amelyre a likelihood maximális. ténetet, azaz a fa belso 13.2-4. Írjuk fel a takarékossági elv kis problémáját a (13.40) képlethez hasonló alakban (csak az összegzések helyett minimumok szerepeljenek), és mutassuk meg, hogy Sankoff algoritmusa tulajdonképpen Felsenstein algoritmusához hasonló átrendezésen alapszik. 13.2-5. Fitch algoritmusa a következoképen muködik. Minden r csúcshoz hozzárendelünk egy karakterhalmazt, C r -t, a levelekhez egyelemu halmazokat, amelyek az adott levélen ta csúcshoz pedig lálható karaktert tartalmazzák, minden r belso
∩t∈D(r) Ct , ∪t∈D(r)Ct
ha
∩t∈D(r) Ct , ∅ , egyébként .
Miután elértünk a gyökérhez, a gyökérhez rendelt halmazból tetszolegesen kiválasztunk csúcsból kiválasztjuk ugyanazt a egy karaktert, majd lefelé haladva minden egyes belso csúcshoz rendeltünk, amennyiben szerepel ez a karakter karaktert, mint amit a felette levo az adott halmazban, egyébként egy tetszoleges karaktert választunk. Mutassuk meg, hogy így egy legtakarékosabb történethez jutunk. Mennyi lesz ezen algoritmus futási ideje? 13.2-6. Mutassuk meg, hogy a 13.2.1. pontban megadott algoritmussal minden lehetséges legtakarékosabb evolúciós történetet megkaphatunk. Adjunk példát olyan legtakarékosabb történetre, amelyet Fitch algoritmusával nem kaphatunk meg.
13.3. Algoritmusok sztochasztikus nyelvtanokon Az alábbiakban generatív nyelvtanok sztochasztikus változataival fogunk foglalkozni. A sztochasztikus generatív nyelvtanok központi szerepet játszanak a modern bioinformatikában. Két nyelvtantípus terjedt el széles körben, a rejtett Markov-modellek leggyakoribb
555
13.3. Algoritmusok sztochasztikus nyelvtanokon
alkalmazási területei fehérjék térszerkezetének jóslása, illetve génkeresés, a sztochasztikus környezetfüggetlen nyelvtanok pedig az RNS molekulák másodlagos szerkezetének jóslásában játszanak fontos szerepet.
13.3.1. Rejtett Markov-modellek: el®re, hátra és Viterbi algoritmusa Az alábbiakban deniáljuk formálisan a rejtett Markov-folyamatokat. Legyen adva állapo és a végállapot. tok egy véges X halmaza. A halmazban van két kitüntetett elem, a kezdo Az állapotokat két részhalmazra bontjuk, emittáló és nem-emittáló állapotokra. Egyelore és a végállapot nem emittáló. Késobb feltesszük, hogy csak a kezdo látni fogjuk, hogy ez a feltételezés nem túl szigorú (lásd 13.3-3. gyakorlat). Megadunk egy M transzformációs mátrixot, melynek egy mi j eleme megadja az i-bol a j állapotba ugrás valószínuségét, így értelemszeruen a mátrix nem-negatív, és minden sor összege 1 (teljes valószínuség tétele). A végállapotra a mátrix nem tartalmaz sort, a kezdore oszlopot. Megadunk egy
Σ ábécét, és minden emittáló állapotra egy eloszlásfüggvényt az ábécé
elemein, amely megmondja, hogy az adott állapot mely valószínuséggel melyik karaktert fogja emittálni amikor a folyamat az adott állapotban van. valószínuségét, hogy az i állapot az
ω
πiω -vel
fogjuk jelölni annak a
karaktert emittálja, feltéve persze, hogy az i álla-
(START ) állapotból indul, és a végállapotba potban van a folyamat. A folyamat a kezdo (END) érkezik. A START állapotba ugrani nem lehet. Minden egyes diszkrét idopontban a folyamat továbbhalad, a megadott M mátrix szerint. Minden emittáló állapot emittál egy karaktert, mikor a folyamat az adott állapotban van. A folyamat attól válik rejtetté, hogy mi csak az emittált karakterek láncát látjuk, magát a folyamatot nem. Néha elofordul, hogy és végállapotot, ekkor meg kell adni egy kezdeti eloszlást, hogy a nem vezetünk be kezdo T
=
0 idopontban melyik állapotban vagyunk (azaz melyik állapot emittál eloször). Há-
rom fontos kérdést tehetünk fel, melyeket dinamikus programozási algoritmussal fogunk megválaszolni. kérdésünk a következo: adott egy Markov-folyamat, és egy emittált szekvencia. Az elso Adjuk meg a Markov-folyamaton azt az utat, amelyik az adott szekvenciát emittálta, és a valószínusége a legnagyobb. A kérdéses út megtalálását Viterbi algoritmusával oldjuk meg, ami szintén dinamikus k karakterébol álló programozási algoritmus. Szokás szerint Ak jelöli az A szekvencia elso szekvenciát, és ak a k-adik karaktert. A dinamikus programozás azon alapszik, hogy ha ismerjük minden k-ra és i-re a Prmax { Ak , i} valószínuséget, azaz az Ak szekvenciát emittáló, o utak valószínuségei és aktuálisan az i állapotban végzod közül a maximálisat, akkor Prmax { Ak+1 , j}
= max(Prmax {Ak , i} mi, j πaj + ) . i
k 1
(13.42)
A képlet abból adódik, hogy annak a valószínusége, hogy egy út az adott szekvenciát emittálta, egyszeruen a szorzata az egyes ugrások valószínuségének és az egyes emissziók valószínuségének. Ha adva van ilyen szorzatok halmaza, amelyekben az utolsó két szorzóté ugyanaz (jelen esetben mi, j π nyezo
j ak+1
), akkor ezek közül az a maximális, amelyikben a
szorzata maximális. többi szorzótényezo Ha megjegyezzük, hogy az adott Prmax { Ak+1 , j} kiszámításához melyik i-t használtuk fel, akkor nyomon tudjuk követni a maximális emittáló útvonalat. Az END állapot nem
556
13. Bioinformatika
emittál, így az algoritmus befejezodése Prmax { A}
= Prmax {A,
END}
= max(Prmax {A, i} mi,END ) ,
(13.43)
i
ahol Prmax { A} a legvalószínubb út valószínusége. Ha nincsen végállapot, akkor Prmax { A}
= max(Prmax {A, i}) .
(13.44)
i
Ha van START állapot, akkor a folyamat szükségképpen a START állapotból indul, úgyhogy Prmax { A0 , START }
= 1. Ha nincs start állapot, akkor Prmax { A1 , j}
=
j
p j πa1
,
(13.45)
ahol p j annak a valószínusége, hogy a folyamat a j állapotból indul. ha adott egy Markov-folyamat, és egy emittált szekA második kérdésünk a következo: vencia, akkor mi annak a valószínusége, hogy az adott Markov-folyamat az adott szekvenciát emittálta? Ez a valószínuség egyszeruen az emittáló utak valószínuségeinek az összege. Mivel azonban a lehetséges emittáló utak száma exponenciálisan nohet a szekvencia hosszával, a naiv módszer, miszerint számoljuk ki minden egyes út valószínuségét, és adjuk ezeket össze, nem járható. Dinamikus programozással azonban kiszámolható a kérdéses valószínuség. Ezt a dinamikus programozási algoritmust hívják F algoritmusnak, és nagyon hasonlít Viterbi algoritmusára, csak maximum helyett összegzések vannak benne. A dinamikus programozás azon alapszik, hogy ha ismerjük minden k-ra és i-re a Pr { Ak , i} valószínuséget, azaz o utak valószínuségeinek az Ak szekvenciát emittáló, és aktuálisan az i állapotban végzod összegét, akkor Pr { Ak+1 , j}
=
X
j
Pr { Ak , i} mi, j πak+1
.
(13.46)
i
Az END állapot nem emittál, így az algoritmus Pr { A}-t a következoképen számolja ki: Pr { A}
= Pr {A,
END}
=
X
Pr { A, i} mi,END
.
(13.47)
i
A
legvalószínubb
emisszió
útját
ki
tudjuk
számolni,
és
ebbol
megkaphatjuk
azt,
hogy a legvalószínubb úton mely karaktert mely állapot emittálta. Azonban ennek az útvonalnak lesznek jobban és kevésbé megbízható részei. Ezért érdeklodhetünk a
Pr ak -t az i állapot emittálta
| a folyamat az A szekvenciát emittálta
valószínuség iránt is,
ami a harmadik olyan kérdésünk, melyet dinamikus programozással válaszolunk meg. Ez a valószínuség nem más, mint azon utak valószínuségeinek az összege, melyekre az i állapot bocsátotta ki az ak karaktert, osztva a teljes kibocsátási valószínuséggel. A kérdéses utak száma exponenciálisan nohet a szekvencia hosszával, így a naiv algoritmus, amely megkeresi ezen utakat, és egyesével összeadja a valószínuségeiket, megint csak nem járható a gyakorlatban. k
Eloször is ki kell számolni annak a valószínuségét, hogy egy folyamat az A szekvenciát k
emittálta, feltéve, hogy ak -t a i állapot emittálta, ahol A az A szekvencia vége, a k
+ 1-edik
kezdve. Ezt karaktertol n ao Forward algoritmushoz hasonló B algoritmussal lehet k
megadni. Jelöljük Pr A
,i
k
-vel annak a valószínuségét, hogy egy folyamat az A szekvenciát
557
13.3. Algoritmusok sztochasztikus nyelvtanokon
emittálta, feltéve, hogy ak -t a i állapot emittálta. Ekkor
n
k
Pr A
,
o i
=
X
n
k+1
(Pr A
,
o
j
j mi, j πak+1 )
.
(13.48)
j
Jelöljük a Pr ak -t az i állapot emittálta get Pr {ak
| a folyamat az A szekvenciát emittálta
valószínusé
= i|A}-val. Pr {ak
= i|A} Pr {A} = Pr {A ∧ ak = i} = Pr {Ak , i} Pr n
amibol: Pr {ak
= i|A} =
Pr { Ak , i} Pr A Pr { A}
k
,
n A
k
,
o i
,
(13.49)
o i
,
(13.50)
ami éppen a keresett valószínuség.
13.3.2. Sztochasztikus környezetfüggetlen nyelvtanok: belülr®l, kívülr®l és a CYK algoritmus Megmutatható, hogy minden környezetfüggetlen nyelvtan átírható úgynevezett Chomskyféle normálformába. A Chomsky-féle normálformában minden levezetési szabály Wv Wy Wz vagy Ww
→
→
a alakú, ahol minden W nemterminális szimbólum, a pedig terminális
szimbólum. A sztochasztikus környezetfüggetlen nyelvtanokban a levezetési szabályokhoz valószínuségeket rendelünk és minden nemterminális szimbólum lehetséges levezetéseihez rendelt valószínuségek összege 1. Legyen adott egy sztochasztikus környezetfüggetlen nyelvtan és egy szekvencia (szó). Mi a szekvencia levezetésének a valószínusége, Három kérdést tehetünk fel, az elso: azaz a lehetséges levezetések valószínuségeinek az összege. A második kérdés az, hogy mi a legvalószínubb levezetés, a harmadik pedig az, hogy mi annak a valószínusége, hogy egy részszót egy adott W x nemterminálisból kiindulva vezettük le, feltéve, hogy az adott szót kérdésre két algoritmust vezettük le. Hasonlóan a rejtett Markov-folyamatokhoz, az elso adunk meg, a K´ ¨ , illetve a B ¨ algoritmusokat, melyek analógok az E ¨ , illetve H ´ ´ algoritmusokkal. A második kérdésre a CYK (CockeYoungerKasami) algoritmus adja meg a választ, amely a V algoritmussal analóg. A harmadik kérdésre pedig a K´ ¨ és a B ¨ algoritmusok közös alkalmazásával kaphatunk választ. A algoritmusok hasonlóak a rejtett Markov-folyamatok algoritmusaihoz, bemutatásra kerülo azonban lényegesen nagyobbak. a futási idok Jelöljük a Wv
→
Wy Wz levezetés valószínuségét tv (y, z)-vel, a Wv
színuségét ev (a)-val. A B ¨ algoritmus minden i
≤
→
a levezetés való-
j-re és v-re kiszámolja az
α(i, j, v)
valószínuséget, ami annak a valószínusége, hogy a Wv nemterminálisból levezetjük az ai -tol részszót. A dinamikus programozás kezdeti feltételei: a j -ig terjedo
α(i, i, v) = ev (ai ) ,
(13.51)
rekurzió: minden i-re és v-re. A fo
α(i, j, v) =
j− 1 M X M X X
y=1 z=1
k=i
α(i, k, y)tv (y, z)α(k + 1, j, z) ,
(13.52)
558
13. Bioinformatika
ahol M a nemterminális szimbólumok száma. A dinamikus programozási táblázat egy felso háromszög mátrix minden nemterminális szimbólumra. A táblázat kitöltése a foátlóval kez sarok felé, a foátlóval dodik, és innen haladunk a jobb felso párhuzamosan töltve ki a mát-
α(1, L, 1) adja meg, ahol L a szekvencia hossza, W1 pedig Θ(L3 M 3 ), a memóriaigény Θ(L2 M). minden i ≤ j-re és v-re a β(i, j, v) számokat számolja ki, ami
rixot. A levezetés valószínuségét
nemterminális. Az algoritmus futási ideje a kezdo A K´ ¨ algoritmus
a j -ig terjedo részszót Wv vezeti le osztva azon levezetések valószínusége, melyben az ai -tol
α(i, j, v)-vel, illetve 0, ha α(i, j, v) = 0. Az algoritmus kezdeti feltételei: β(1, L, 1) = 1 , β(1, L, v) = 0
(13.53)
ha
v
,1.
(13.54)
rekurzió: A fo
β(i, j, v)
M X i−1 M X X
=
α(k, i − 1, z)ty (z, v)β(k, j, y) +
y=1 z=1 k=1 M X M L X X
α( j + 1, k, z)ty (v, z)β(i, k, y) .
(13.55)
y=1 z=1 k= j+1
A (13.55) képlet helyessége abból adódik, hogy végignézzük az összes lehetoséget, hogy az a nemterminális szimbólum, amely Wv -t levezette, mely részét vezette le a szekvenciának. Mint látható, a számoláshoz szükségünk van az
α-kra,
ilyen téren a K´ ¨ algoritmus
eltér a H ´ ´ algoritmustól, amelyet futtathatunk anélkül, hogy az E ¨ algoritmust mindenképpen le kell futtatni a B alkalmaztuk volna, míg a K´ ¨ algoritmus elott ¨ -
algoritmust. A CYK algoritmus kezdeti értékeinek beállítása megegyezik a B ¨ kezdeti érté rekurzió is nagyon hasonlít a B keinek beállításával, a fo ¨ algoritmus rekurziójához, csak összeadás helyett maximalizálni kell:
αmax (i, j, v) = max max y
z
max
i≤k≤ j−1
αmax (i, k, y)tv (y, z)αmax (k + 1, j, z) .
A legvalószínubb levezetés valószínuségét pedig
(13.56)
αmax (1, L, 1) adja meg. A legvalószínubb
levezetést az optimális értékeket adó levezetési szabályokon keresztül kaphatjuk meg. a j -ig terjedo részszót, Végezetül annak a valószínuségét, hogy Wv vezette le az ai -tol feltéve, hogy az A szekvenciát vezettük le,
α(i, j, v)β(i, j, v) α(1, L, 1)
(13.57)
adja meg.
Gyakorlatok 13.3-1. A reguláris nyelvtanokban a levezetési szabályok Wv
→ aWy vagy Wv → a alakúak.
Mutassuk meg, hogy minden rejtett Markov-folyamat sztochasztikus reguláris nyelvtan, de nem minden sztochasztikus reguláris nyelvtan rejtett Markov-folyamat. 13.3-2. Adjunk meg dinamikus programozási algoritmust, mely adott sztochasztikus reguláris nyelvtanra és A szekvenciára megadja a
559
13.3. Algoritmusok sztochasztikus nyelvtanokon
•
levezetés valószínuségét,
•
a legvalószínubb levezetést,
•
valamint annak a valószínuségét, hogy a szekvencia egy adott ai karakterét egy adott levezetési szabály vezette le.
13.3-3. Egy rejtett Markov-modellben lehetnek úgynevezett csendes vagy nem kibocsátó állapotok, melyek a rejtett Markov-modell ábrázolását elosegíthetik. Mutassuk meg, hogy minden rejtett Markov-modell, mely csendes állapotokat tartalmaz, átírható olyan rejtett Markov-modellé, amely nem tartalmaz csendes állapotokat, és ekvivalens az eredeti modellel, azaz ugyanazon szekvenciákat ugyanakkora valószínuséggel bocsátja ki. 13.3-4.
A páros rejtett Markov-modellek olyan rejtett Markov-modellek, melyekben az
egyes állapotok nem csak egy szekvenciába bocsátanak ki karaktereket, hanem kettobe. Egyes állapotok csak az egyik szekvenciába, mások csak a másikba, ismét mások pedig mindkét szekvenciába bocsátanak ki karaktereket. Egy állapot egy lépésben mindegyik szekvenciába legfeljebb egy karaktert bocsáthat ki. Adjuk meg a páros rejtett Markovfolyamatok V, E és H algoritmusait. ´ 13.3-5. Viterbi algoritmusában nem használtuk ki, hogy a tranzíciók és a kibocsátási való színuségek valószínuségek, azaz nem negatívak és eggyé összegzodnek. Valamint az algoritmus akkor is muködik, ha szorzás helyett összeadások vannak, és maximalizálás helyett akár minimalizálhatunk is. Adjunk meg egy olyan módosított páros rejtett Markov-modellt (amelyben a
valószínuségek nem feltétlenül nem negatívak, és nem feltétlenül összeg zodnek eggyé), melyre Viterbi algoritmusa összeadásokkal és minimalizálással ekvivalens Gotoh algoritmusával. 13.3-6. Másodlagos térszerkezetnek nevezzük az RNS-ek olyan bázispárosodását, amely a szekvencia fölött haladó ívek nem metben a bázispárosodott nukleinsavakat összeköto, szik egymást. A lehetséges bázispárosodások: A − U , U
− A, C − G, G − C, G − U
és U
− G.
Adjunk meg egy dinamikus programozási algoritmust, amely egy adott RNS szekvenciára megkeresi azt a másodlagos térszerkezetet, melyben a párosodott nukleinsavak száma maximális. 13.3-7. A KnudsenHein-nyelvtan levezetési szabályai:
S
→
LS | L
F
→ →
dFd | LS
L
,
s|dFd
,
,
ahol minden s terminális levezetést még helyettesíteni kell az RNS szekvenciák lehetséges karaktereivel, a dFd kifejezésben pedig a két d terminális szimbólumot helyettesíteni kell a lehetséges bázispárosodásokkal. Mutassuk meg, hogy adott szekvencia és a levezetések adott valószínuségi eloszlása esetén meg lehet adni egy olyan dinamikus programozási algoritmust, amely megadja a szekvencia levezetésének a valószínuségét, anélkül, hogy Chomsky-féle normálformába írnánk át a nyelvtant.
560
13. Bioinformatika
13.4. Szerkezetek összehasonlítása szerkezeteket hasonlítunk össze dinamikus programozási alAz alábbi részben különbözo goritmusok segítségével. Mint meg fogjuk mutatni, a címkézett, gyökeres fák illesztésére használt algoritmus általánosítása a szekvenciák összehasonlítására használt algoritmusnak. algoritmus egy lineáris egyenletA rejtett Markov-modellek összehasonlítását végzo rendszer megoldásával adja meg két rejtett Markov-modell együttes kibocsátásának a valószínuségét, azaz annak a valószínuséget, hogy két rejtett Markov-modell ugyanazt a szekvenciát bocsátja ki.
13.4.1. Címkézett, gyökeres fák illesztése Σ egy véges ABC, Σ− = Σ ∪ {−}, Σ2 = Σ− × Σ− \{−, −}. Egy F fa címkézésén egy olyan függvényt értünk, mely az F fa minden egyes n ∈ VF csúcsához hozzárendeli Σ egy
Legyen
karakterét. Ha egy gyökeres fából kitörlünk egy csúcsot, akkor a kitörölt csúcs gyerekei a kitörölt csúcs szülojének a gyerekei lesznek. Amennyiben a fa gyökerét töröljük ki, a fa er dore esik szét. Legyen A egy gyökeres fa, melynek csúcsai az ezt meghatározó függvény legyen c : VA és G
→ Σ
2
Σ2
elemeivel vannak címkézve,
. Azt mondjuk, hogy A illesztése az F
Σ karaktereivel címkézett, gyökeres fáknak, ha
és második koA címkézéseinek elso
ordinátáján vett megszorításával, és az így '−' szimbólummal címkézett csúcsok törlésével rendre az F és G fákat kapjuk vissza. Legyen adva egy hasonlósági függvény, s :
Σ2 →
R. Erre a hasonlósági függvényre
semmilyen megkötést nem teszünk, egy karakter lehet akár kevésbé hasonló önmagához, mint egy másik karakterhez. F és G fák optimális illesztésén egy olyan kézett A fát értünk, melyre
Σ2
elemeivel cím-
X s(c(n))
(13.58)
n∈VA
maximális. Ezt a fát AF,G -vel fogjuk jelölni. Vegyük észre, hogy egy szekvencia ábrázolható olyan faként, melynek egyetlen levele van. A továbbiakban csak olyan fákkal foglalkozunk, melyekben bármely csúcsnak legfeljebb két gyereke van. Az optimális illesztést megadó dinamikus programozás a gyökeres részfákon történik, ezek azon részfák, melyek a fa egy adott csúcsát, mint gyökeret és ezek leszármazottjait tartalmazzák. Az r gyökér által meghatározott részfát tr -rel jelöljük. Egy fát egy üres fához csak egyféleképen illeszthetünk. Két, a, ill. b karakterekkel címkézett levél illesztése csak három módon lehetséges: az illesztés vagy egyetlen csúcsot tartalmaz, és (a, b)-vel van címkézve, vagy két csúcsot tartalmaz, ezek közül az egyik (a, −), a másik (−, b) címkézésu, és a két csúcs közül az egyik a gyökér, a másik ennek a gyereke. Ez utóbbi két lehetoség ekvivalens a hasonlósági függvény szempontjából. Hasonlóan, egy levelet egy gyökeres részfával úgy lehet összeilleszteni, hogy az A illesztésben vagy együtt van címkézve a levél karaktere a részfa valamely karakterével, vagy egy '−' szimbólummal van együtt címkézve. Ez utóbbi címkézést tartalmazó csúcsot a részfába sokféleképen lehet beszúrni, de ezek mindegyike ekvivalens. Ezután az inicializáció után a dinamikus programozásban egyre nagyobb részfákat illesztünk össze. Feltehetjük, hogy tr , illetve t s részfák esetében ismerjük már az Atr ,t x , Atr ,ty , Atu ,t s , Atv ,t s , Atu ,t x , Atu ,ty , Atv ,t x és Atv ,ty illesztéseket, és ezen illesztések értékeit, ahol u és v csúcsok r gyerekei, x és y csúcsok pedig s gyerekei (amennyiben valamelyik csúcsnak csak
561
13.4. Szerkezetek összehasonlítása
egy gyereke van, akkor természetesen kevesebb részproblémára vezetjük vissza a problémát). Valamint ismerjük a tu , tv , t x és ty fáknak az üres részfához való illesztésének az értékét is. Legyen r címkézése a, s címkézése b. Ezek után Atr ,t s meghatározásához konstans sok lehetoséget kell végignézni: vagy az egyik részfa a másik részfában valamely gyerek hez van illesztve, és ekkor a másik gyerek és a gyökér a '−' szimbólummal címkézodik az illesztésben, vagy r és s összeillesztodik, vagy bár nem illesztodnek össze, de Atr ,t s -ben az csúcs a gyökér, a másik pedig ennek a gyereke. Ez utóbbi két egyik gyökérnek megfelelo esetben a gyerekeket vagy összeillesztjük, vagy nem. Zz öt lehetséges eset. a fa csúcsainak számával, az optiMivel a lehetséges gyökeres részfák száma egyenlo mális illesztés megkeresheto
Θ(|F ||G|) idoben, ahol | F | és |G | F
és G csúcsainak száma.
13.4.2. Két rejtett Markov-modell együttes kibocsátási valószín¶sége Legyen adva két Markov-modell, M1 és M2 . A két modell együttes kibocsátási valószínu sége deníció szerint: C(M1 , M2 )
=
X
Pr M1 { s} Pr M2 { s} ,
(13.59)
s
ahol az összegzés az összes lehetséges szekvencián megy, Pr M { s} pedig annak a valószínu sége, hogy az M modell az s szekvenciát bocsátotta ki. Azt, hogy a p út az s szekvenciát bocsátotta ki, e( p)
=
s-sel jelöljük, egy START állapottól x állapotig tartó utat pedig [x]-szel.
Mivel a kibocsátási valószínuség a lehetséges kibocsátó utak valószínuségeinek az összege,
C(M1 , M2 )
=
X s
=
X Pr M1 p1 ∈ M1 ,e( p1 )= s
{ p1 }
X
Pr M1
X Pr M2 p2 ∈ M2 ,e( p2 )= s
{ p2 }
{ p1 } Pr M { p2 } .
(13.60)
2
p1 ∈ M1 , p2 ∈ M2 ,e( p1 )=e( p2 )
Ez utóbbi képletben gyelembe kell venni, hogy egy útvonalra több lehetséges kibocsátás van, az összegzések a lehetséges útvonalak és kibocsátások együttesein mennek, az útvonal valószínuségébe pedig beleértjük a kibocsátási valószínuségeket is. Jelöljük p ¯ 1 -gyel azt kapunk a végállapot elhagyásával, valamint p1 -nek az END1 az útvonalat, amelyet p1 -bol állapot elotti állapota legyen x1 . ( p ¯ 2 -t és x2 -t hasonlóan deniáljuk.) Ekkor C(M1 , M2 )
X
=
m x1 ,END1 m x2 ,END2 Pr M1
{ p¯ 1 } Pr M { p¯ 2 } 2
p1 ∈ M1 , p2 ∈ M2 ,e( p1 )=e( p2 )
=
X
m x1 ,END1 m x2 ,END2 C(x1 , x2 )
,
(13.61)
x1 , x2
az END állapotba ugrás valószínusége, ahol m x,END az x-bol valamint C(x1 , x2 )
X
=
Pr M1 {[x1 ]} Pr M2 {[x2 ]}
.
(13.62)
,
(13.63)
[x1 ]∈ M1 ,[x2 ]∈ M2 ,e([x1 ])=e([x2 ])
képlettel is: C(x1 , x2 )-t meg lehet adni a következo C(x1 , x2 )
=
X y1 ,y2
my1 , x1 my2 , x2 C(y1 , y2 )
X σ∈Σ
Pr {σ| x1 } Pr {σ| x2 }
562
13. Bioinformatika
ahol Pr {σ| xi } annak a valószínusége, hogy az xi állapot
σ-t bocsátotta ki. A (13.63) képlet
egy lineáris egyenletrendszert deniál az összes x1 és x2 kibocsátó állapotokra. A kezdeti feltételek: C(START 1 , START 2 )
= = =
C(START 1 , x2 ) C(x1 , START 2 )
,
1
(13.64)
0,
x2
0,
x1
, START 2 , , START 1 .
(13.65) (13.66)
Azonban a dinamikus programozás a szokásostól eltéroen nem egy táblázat kitöltésével, hanem a (13.63) képlet által meghatározott egyenletrendszer megoldásával történik. Így az együttes kibocsátási valószínuség meghatározható O (n1 n2 )
3
idoben, ahol ni az Mi modell-
ben a kibocsátó állapotok száma.
Gyakorlatok 13.4-1. Adjuk meg két fa lokális hasonlóságát, ami a két fa leginkább hasonló részfái il részét érjük. lesztésének az értéke. Részfán most a fa tetszoleges összefüggo 13.4-2. Rendezett fákon olyan gyökeres fákat értünk, melyben minden csúcs gyerekei ren dezve vannak. Rendezett fák rendezett illesztése megorzi a két fa gyerekeinek a rendezését. Adjunk olyan algoritmust, amely két rendezett fának egy optimális rendezett illesztését adja meg, és a számolási igénye mind a fák csúcsszámának, mind a gyerekszám maximális értékének polinomiális függvénye. 13.4-3. Vegyük azt a végtelen dimenziós euklideszi teret, melynek a koordinátái a lehetséges szekvenciák. Minden rejtett Markov-modell egy vektorral adható meg ebben a térben, a vektor j-edik koordinátája megadja a j-edik szekvencia levezetésének a valószínuségét. Határozzuk meg két rejtett Markov-modell által bezárt szöget ebben a térben. 13.4-4. Adjuk meg egy rejtett Markov-modell által kibocsátott szekvenciák hosszainak generátorfüggvényét, azaz a
∞ X
pi ξ
i
i= 0
függvényt, ahol pi annak a valószínusége, hogy a rejtett Markov-modell i hosszúságú szekvenciát bocsájt ki. 13.4-5. Adjuk meg egy páros rejtett Markov-modell által kibocsátott szekvenciák hosszainak generátorfüggvényét, azaz a
∞ X ∞ X i=0
pi, j ξ
i
ηj
j=0
függvényt, ahol pi, j annak a valószínusége, hogy a rejtett Markov-modell által kibocsátott szekvencia i, a második pedig j hosszúságú. elso
13.5. Törzsfakészítés távolságon alapuló algoritmusokkal irányítatlan, súlyozott élu, Ebben a fejezetben törzsfákon olyan összefüggo, körmentes gráfokat értünk, melyben semelyik csúcsnak nincs kettes fokszáma. A súlyok nem negatívak, csúcsot köt össze, a súlyok pozitívak. Olyan törzsés minden olyan élre, mely két belso módszerekkel ismerkedünk meg, amelyek bemeno adatai objektumok halmaza, fakészíto
13.5. Törzsfakészítés távolságon alapuló algoritmusokkal
563
valamint mindegyik objektumpárra megadott távolság. Ez a távolság származhat például vett távolságokból, de az itt bemutatásra kerülo algoszekvenciák optimális illesztésébol ritmusok tetszoleges távolságokra muködnek. A fák levelei a megadott objektumok, a fa topológiáját és a fa éleinek a hosszát pedig a távolságadatokból származtatjuk. Minden fa ábrázol egy, a leveleken, mint objektumokon deniált metrikát: két objektum közötti tá út hosszával deniáljuk. Az algoritmusok jóságát volságot az ezen objektumokat összeköto lehet mérni a bemeneti távolságok és a megkonstruált fa által meghatározott távolságok közötti különbséggel. Két speciális metrikát fogunk deniálni, az ultrametrikát és az additív metrikát. Az osztályozó algoritmusok mindig olyan törzsfát készítenek, amelyek ultrametrikát reprezen távolságok tálnak. Be fogjuk bizonyítani, hogy amennyiben a bemeneti adatokban szereplo ultrametrikus tulajdonságúak, akkor az osztályozó algoritmusok által meghatározott fa pontosan ezt fogja reprezentálni. Hasonlóan a szomszédok egyesítése módszer additív metrikát reprezentáló fát készít, távolságokokra teljesül az additív metrika, akkor a szomszédok egyesítése és ha a bemeno visszaadja ezt a metrikát. Mindkét bizonyítás esetében szükségünk lesz az alábbi lemmára: 13.3. lemma. Bármely metrikára legfeljebb egy olyan fa van, amely ezt ábrázolja. Bizonyítás. Két objektumra az állítás triviális. A bizonyítás indirekten, teljes indukcióval történik. Az indukciót három objektummal kezdjük. Három objektum esetében egyetlen fa csúcsával összeköto topológia létezik, a csillag alakú. Legyen az i, j és k leveleket a fa belso élek hossza rendre x, y és z. Az élek hosszait az
+y = x+z = y+z =
x
di, j di,k
, ,
dk,l
(13.67) (13.68) (13.69)
egyenletrendszer adja meg, aminek egyetlen megoldása van, mivel az
1 1 0
1 0 1
1 0
(13.70)
1
determináns nem 0. n
> 3 objektum esetében tegyük fel, hogy van két fa, amely ugyanazt a metrikát repre-
fán keressünk két olyan levelet, i-t és j-t, melyeket összeköto úton zentálja. Ekkor az elso egyetlen egy csúcs van, legyen az a csúcs u. Ilyen i és j csúcsokat minden fában találunk, csúcsok száma a legnagyobb, az út mindkét vegyünk egy olyan utat a fában, melyben a belso úton egyetlen csúcs végén ilyen levélpár található. Ha a második fában i-t és j-t összeköto csúccsal összeköto élek hossza azonos, és úgyszintén a j-t van, akkor a két fában i-t a belso csúccsal összeköto élek hossza azonos, mivel tetszoleges a belso k(, i, j) objektumra mindkét fa esetében ugyanazt a részfát kell kapnunk (melyben az u és k közötti utat egyetlen du,k hosszúságú éllel ábrázoljuk). Legyártunk egy új metrikát, melyben elhagyjuk az i és j ob-
0
jektumokat, bevezetünk egy u objektumot, melynek bármely k objektumtól vett távolsága él hossza. A két fában elhagyjuk az i és j csúcsokat, di,k − di,u , ahol di,u , az i-t u-val összeköto
564
13. Bioinformatika
13.2. ábra. Egy dendrogram.
ha u fokszáma 3 volt i és j elhagyása elott, akkor u levél lesz az új fában, és most ez fogja
0
0
reprezentálni u -t, ha u nem levél i és j elhagyása után, akkor u-ba behúzunk egy u levelet, az új él hossza pedig 0. Így olyan fákat kapunk, melyek ezt a metrikát reprezentálják, és az indukció szerint azonosak. úton nem egy csúcs van, akkor ellentHa viszont a második fában i-t j-vel összeköto úton egy olyan u1 csúcs, mondásra jutunk. Ugyanis ebben a fában van az i-t j-vel összeköto melyre di,u
, di,u
1
. Vegyünk a második fában egy olyan k csúcsot, melyre az i-t k-val össze-
út áthalad u1 -en. Az elso fából számolva köto
− d j,k = di,u − d j,u = 2di,u − di, j ,
(13.71)
− d j,k = di,u − d j,u = 2di,u − di, j ,
(13.72)
di,k míg a második fán di,k
ami ellentmond annak, hogy di,u
1
, di,u
1
1
1
.
13.5.1. Osztályozó algoritmusok 13.4. deníció. Egy metrikát ultrametrikának nevezünk, ha bármely i, j és k csúcsokra di, j
≤ max{di,k ,
d j,k }
(13.73)
Könnyen belátható (lásd 13.5-1. gyakorlat), hogy egy ultrametrikában bármely három csúcs három távolság vagy mind azonos, vagy közülük ketto azonos, a harmadik pedig között levo ennél kisebb. 13.5. tétel. Ha objektumok egy véges halmazán deniált metrika ultrametrika, akkor pontosan egy olyan fa létezik, amely ezt ábrázolja. Továbbá ezt a fát le lehet gyökereztetni úgy, hogy minden levélnek a gyökértol vett távolsága azonos legyen. Bizonyítás. A 13.3. lemma alapján legfeljebb egy ilyen fa van, így elég megkonstruálni egy ilyen fát bármely ultrametrikára. Az ultrametrikus fákat dendrogramokként fogjuk ábrázolni, ezekben a reprezentációkban a vízszintesen húzott élek hosszát 0-nak tekintjük (lásd 13.2. ábra). A tétel bizonyítása a levelek, mint objektumok száma szerinti indukcióval törté objektum esetében nyílván meg tudjuk konstruálni a dendrogramot. Ha n levélre nik. Ketto
565
13.5. Törzsfakészítés távolságon alapuló algoritmusokkal
-
6 di,n+1 /2
i
13.3. ábra. Az (n
j
i
i
0
n
? +1
+ 1)-edik levél bekötése a dendrogramba.
megkonstruáltuk már a dendrogramot, az (n
+ 1)-edik
levéllel a következoképpen járunk
elindulunk a gyökér felé, el: Keresünk egy olyan i-t, melyre di,n+1 minimális. Ezután i-bol és di,n+1 /2 magasságban kötjük be az (n
+ 1)-edik levelet (lásd 13.3. ábra). Ez a dendrog vett távolságát. Ugyanis + 1)-edik levéltol + 1-ik levél bekötésének helye alatt helyezkedik
ram helyesen ábrázolja az összes csúcsnak az (n az összes olyan i el, di,i 0
≤
0
csúcsra, amely az n
di,n+1 , és az ultrametrikus tulajdonságból, valamint di,n+1 minimalitásából követ-
kezik, hogy ekkor di,n+1
=
di 0 ,n+1 . Másrészt az összes többi j csúcsra di, j
ultrametrikus tulajdonságból adódóan ekkor d j,n+1
>
di,n+1 , és az
= di, j .
2
Könnyen belátható, hogy a bizonyításban használt megkonstruálás számolási igénye O(n ), ahol n az objektumok száma. Megadhatunk egy másik algoritmust is, amely megkeresi azt az i és j objektumpárt, amire di, j minimális. Az ultrametrikus tulajdonságból adódóan minden k-ra di,k
= d j,k (≥ di, j ), így az i és
j objektumpárt lecserélhetjük egyetlen új objektumra,
vett távolsága jól deniált. Az i és a j objektués ezen új objektumnak az összes többitol mot összekötjük di, j /2 magasságban, és az így kapott részdendrogramot egy objektumnak tekintve folytatjuk az iterációt. Ez az algoritmus lassabb, mint az elobbi bizonyításban megadott algoritmus, viszont ez az alapja az úgynevezett osztályozó algoritmusoknak. Az osz távolságok nem tályozó algoritmusok mindig dendrogramot adnak, akkor is, ha a bemeno adatok ultrametrikus tulajdonságúak, akkor az alkotnak ultrametrikát. Viszont ha a bemeno osztályozó algoritmusok többsége pontosan visszaadja az ezt reprezentáló dendrogramot. Mindegyik osztályozó algoritmus azt az i és j objektumokat (illetve az iteráció további lépéseiben objektumok helyett objektumhalmazok is szerepelhetnek) keresi meg, amelyre di, j minimális. A módszerek közötti különbség abban rejlik, hogy ezután hogyan határozzák meg az új objektumhalmaz és a többi objektum(halmaz) közötti távolságot. Ha az új módszerek következoképpen objektumot u-val jelöljük, akkor az alább ismertetésre kerülo deniálják du,k -t:
•
E : du,k - ´
•
T- : du,k ´
•
C : (UPGMA) u és k elemei páronkénti távolságainak számtani közepe, azaz ´ du,k
= min{di,k , d j,k }.
= max{di,k , d j,k }.
= (di,k ×|i|+ d j,k ×| j|)/(|i|+| j|), ahol |i| és | j| az i és
j objektumhalmazok elemszámai.
•
E : Az átlagok átlagát vesszük, azaz du,k - ´
= (di,k + d j,k )/2.
•
C: Ezt a módszert leggyakrabban akkor alkalmazzák, amikor az objektumok
566
13. Bioinformatika k
| j|
i
u
|i|
j
13.4. ábra. du,k számolása a C módszer szerint.
beágyazhatóak Euklideszi térbe. Ekkor a két objektumhalmaz közötti távolságot az objektumhalmazok centrumai közötti távolságként lehet deniálni. A számoláshoz azonban nem feltétlenül kell az Euklideszi tér koordinátáit használni, hiszen a kérdéses du,k távolság nem más, mint az i, j és k csúcsok által meghatározott háromszögben a k csúcsból kiinduló, az i j szakaszt | j| : |i| arányban osztó szakasz hossza (lásd 13.4. ábra), ez pedig a di, j , di,k és d j,k adatokból már meghatározható. Ez a számolási mód akkor is alkalmazható, ha az objektumok nem ágyazhatók be Euklideszi térbe, így bár a módszer ötlete geometriai indíttatású, bármely távolságmátrixra alkalmazható.
•
M ´ : Az u objektumhalmaz centrumát i és j centrumainak centrumaként deniáljuk. Így ez a módszer úgy viszonyul a centroid módszerhez, mint az egyszeru átlag a csoportátlaghoz. Erre a módszerre is igaz, hogy nem kell du,k számolásához az Euklideszi koordinátákat ismerni, hiszen a keresett távolság az i jk háromszögben a k-ból induló súlyvonal hossza.
négy módszer visszaadja a távolságokat reprezentáló Könnyen belátható, hogy az elso adatok ultrametrikus tulajdonságúak, hiszen ekkor dendrogramot, amennyiben a bemeno di,k
=
d j,k . A C és a M ´ módszerek azonban nem adják vissza az ultrametrikát
d j,k -val). reprezentáló dendrogramot, hiszen du,k kisebb lesz, mint di,k (ami egyenlo Az osztályozó algoritmusok általános problémája, hogy mindig dendrogramot adnak vissza, és ez biológiailag nem feltétlenül helyes. Ugyanis biológiai szekvenciák leszármazási kapcsolatait csak az úgynevezett molekuláris óra muködésének esetében ábrázolja helyesen egy dendrogram. A molekuláris óra elmélet szerint az egyes szekvenciák a törzs fejlodés során adott idotartam alatt ugyanakkora mennyiségu mutáción mentek át, azonban számos biológiai példa mutatja azt, hogy ez nem mindig teljesül. Ezért szeretnénk egy olyan adatsorokra, ha a bemeno táalgoritmust, amely csak akkor ad ultrametrikus fát a bemeno volságok valóban ultrametrikus tulajdonságúak. Ezért mára a S ´
´´
al-
goritmus sokkal népszerubbé vált a bioinformatikai alkalmazásokban, mint az osztályozó algoritmusok.
13.5.2. Szomszédok egyesítése 13.6. deníció. Egy metrikát additív vagy négycsúcs metrikának nevezünk, ha bármely i, j, k és l csúcsára di, j
+ dk,l ≤ max{di,k + d j,l ,
di,l
+ d j,k } .
(13.74)
567
13.5. Törzsfakészítés távolságon alapuló algoritmusokkal k l
u n
+1
i
13.5. ábra. Az (n
+ 1)-edik levél gyökereztetése additív fa megkonstruálásához.
13.7. tétel. Ha objektumok egy véges halmazán deniált metrika additív, akkor pontosan egy olyan fa létezik, amely ezt reprezentálja. Bizonyítás. A 13.3. lemma alapján legfeljebb egy ilyen fa van, így elég megkonstruálni egy ilyen fát bármely additív metrikára. Eloször a konstrukciót adjuk meg, ezután bizonyítjuk a konstrukció helyességét: Három objektumra a (13.6713.69) egyenletek alapján megkonstruálunk egy fát, ezután a konstrukció indukcióval történik, feltesszük, hogy n
≥
3 objektumra már elkészítettük a
fát, az (n + 1)-edik objektumot reprezentáló levelet pedig egy éllel valahova bekötjük a már fába. Ehhez eloször meglévo meghatározzuk az új fa topológiáját, majd az új él hosszát. A indulunk el. Jelöljük i szomszédját topológia meghatározásához egy tetszoleges i levéltol kiinduló utakon keressünk egy-egy u-val, u-ból még legalább két él indul ki, ezen élekbol levelet, jelöljük ezeket k-val és l-lel (lásd 13.5. ábra). Az (n
+ 1)-edik
levél bekötése i-bol
nézve az u csúcson innen van, ha di,n+1
+ dk,l < di,k + dn+1,l .
(13.75)
Hasonlóképpen megállapíthatjuk, hogy az (n + 1)-edik levél bekötése k, illetve az l csúcsból kiinnézve u-n innen van-e. Ha u fokszáma nagyobb, mint három, akkor a további élekbol
0
0
duló utakon is keresünk l csúcsokat, és az i, n + 1, k és l csúcsnégyesekre hasonlóan járunk el. Az additív metrika tulajdonságából következik, hogy legfeljebb egy esetben állhat fenn az adott irányú egyenlotlenség. Ha egyetlen esetben áll fenn ilyen irányú egyenlotlenség, és ez az i levél esete, akkor az (n
+ 1)-edik levelet az i-t u-val összeköto élhez kötjük be. Ha
egyenlotlenség más esetben áll fenn, akkor vesszük azt a maximális részfát, amelynek egy levele u, és tartalmazza az (n + 1)-edik levél bekötését. Deniáljuk du,n+1 -et mint di,n+1 − di,u , és ezután u-t i-nek átnevezve folytatjuk a bekötés helyének keresését. Ha minden esetben egyenloséget kapunk, akkor az (n
+ 1)-edik levelet az u csúcshoz kötjük be.
él Miután megtörtént a bekötés helyének megkeresése, meghatározzuk a beköto hosszát. Ha az (n
+ 1)-ik
élen kötjük be, akkor jelöljük a beköto élt az i-t u-val összeköto
csúcsot u1 -gyel (13.6/b ábra). Deniáljuk du,n+1 -et (dl,n+1
− dl,u )-ként. Ekkor a du,u , di,u , + 1 objektumok távolságait reprezentáló fa adja meg, melyet a (13.6713.69) egyenletek alapján számolunk ki. Ha az (n + 1)-edik levelet az
valamint a du1 ,n+1 távolságokat az i, u és n
1
1
568
13. Bioinformatika l
k
k n
+1
u
k1
l
k1
u u1
i
n
+1
i b)
a) k
l
n
u
+1
i c)
13.6. ábra. Néhány fa topológia a 13.7. tétel bizonyításához.
u csúcshoz kötjük be, akkor du,n+1
= di,n+1 − di,u .
Ezután rátérünk a konstrukció helyességének a bizonyítására. Eloször azt látjuk be, hogy amikor az (n
+ 1)-ik levél bekötésének a helyét keressük, és egy új részfán deniáljuk
a du,n+1 távolságot, akkor a megadott deníció jól deniált, azaz bármely olyan j csúcsra,
− d j,u = di,n+1 − di,u . Ha az új részfa = k csúcsra nyilván teljesül, mely k csúcs alapján határoztuk és meg az (n + 1)-edik levél helyzetét (lásd 13.6/a ábra). Az (n + 1)-edik levél helyzetébol
mely nem szerepel az újonnan deniált részfában, d j,n+1 tartalmazza l-t, akkor ez azon j
az additív metrika tulajdonságából adódóan
+ di,l = di,n+1 + dk,l ,
dk,n+1 ha felhasználjuk a di,l amibol
(13.76)
= di,u + du,l és a dk,l = dk,u + du,l egyenloségeket, adódik, hogy dk,n+1
− dk,u = di,n+1 − di,u .
(13.77)
Ugyanígy minden olyan k1 levélre, melyet nem választ el k-tól az u csúcs, fennáll a dk1 ,n+1
+ di,l = di,n+1 + dk
,l
(13.78)
+ dl,n+1 < dk,n+1 + dk ,l
(13.79)
1
egyenloség. Ez az additív metrikából és a dk,k1
1
adódik, ez utóbbi pedig levezetheto a egyenlotlenségb ol dk,k1
+ di,l < dk ,l + dk,i 1
(13.80)
569
13.5. Törzsfakészítés távolságon alapuló algoritmusokkal
és dl,n+1
+ dk,i < di,l + dk,n+1
(13.81)
Hasonlóan, ha u fokszáma háromnál nagyobb, akkor minden olyan egyenlotlenségekb ol. csúcsra, melyet u elválaszt az (n
hasonló egyenloségek + 1)-edik levéltol, és egyenlotlensé-
gek állnak fenn. Az új élhosszak kiszámolásából adódik, hogy a di,n+1 távolságot helyesen reprezentálja az új fa, és így a d j,n+1 távolságot az összes olyan j csúcsra, melyet i elválaszt (n
+ 1)-tol.
adódóan az ábrán i lehet egy (Ne feledjük el, hogy a beágazás helyének megkeresésébol korábbi u.) Ha az (n
+ 1)-edik levél bekötése az u-t az i-vel összeköto szakaszon van (13.6/b ábra),
akkor du,n+1 deníciójából adódóan dl,n+1 -et is helyesen ábrázolja a fa. A dk,n+1
+ di,l = dk,i + dl,n+1
(13.82)
egyszeruen hogy egyenloségb ol levezetheto, dk,n+1
= dk,u + du,n+1 ,
(13.83)
így a dk,n+1 távolságot is jól reprezentálja a fa. Az elobbi levezetésekkel analóg módon belátható, hogy minden olyan k1 -re, melyet u nem választ el k-tól, a dk1 ,n+1 távolságot helyesen reprezentálja a fa, és valójában az összes olyan j csúcsra, melyet u elválaszt n
+ 1-tol,
a
d j,n+1 távolságot helyesen reprezentálja az elkészített fa. Ha az (n
+ 1)-edik levelet az u csúcshoz kötjük be (13.6/c ábra), akkor a di,n+1
+ dk,l = dk,i + dl,n+1 = dk,n+1 + d j,i
(13.84)
már levezetheto, hogy mind dk,n+1 -et, mind dl,n+1 -et helyesen reprezentálja egyenloségekb ol a fa, és a fentiekhez hasonló okoskodásból következik, hogy ez valójában igaz minden olyan csúcsra, melyet u elválaszt (n
+ 1)-tol.
Ezzel n csúcs távolságait helyesen reprezentáló fából kiindulva megkonstruáltunk egy olyan fát, mely n
+
1 csúcs távolságát reprezentálja helyesen (feltéve, hogy a csúcsokra
teljesül az additív metrika), így bizonyítottuk a 13.7. tételt.
Könnyen belátható, hogy a fenti algoritmus, mely megkonstruálja azt a fát, amely egy 2
igényel. Az algoritmus azonban csak akkor muködik additív metrikát reprezentál, O(n ) idot távolságok additív metrikát alkotnak. Ellenkezo esetben több esetben helyesen, ha a bemeno így nem tudnánk eldönteni, hogy hol kössük be az is fennállhat a (13.75) egyenlotlenség, (n
+ 1)-edik levelet. Az alábbiakban megadunk egy Θ(n3 ) ideju algoritmust, amely szintén
távolságok additív metrikát az additív metrikát reprezentáló fát adja vissza, ha a bemeno alkotnak, de egy additív fát ad vissza egyéb esetekben is. A S muködik: Adott csúcsok egy ´ -´ ´ algoritmus a következoképpen halmaza n elemmel, és egy ezen értelmezett metrika, d. Eloször kiszámítjuk az összes i csúcsra a többi csúcstól vett távolságok összegét:
vi
=
n X
di, j j= 1
.
(13.85)
570
13. Bioinformatika i
l u
w
k
j
csúcs választja el. 13.7. ábra. Az i, j, k és l csúcsok elhelyezkedése, amennyiben i-t és j-t egyetlen u belso
Ezután megkeressük azt a csúcspárt, melyre si, j
= (n − 2)di, j − vi − v j
(13.86)
csúcsig húzott élek hossza minimális. Az i és a j csúcsokból az új, u belso
ei,u
di, j
=
2
illetve e j,u
=
−
vi
− vj , −4
(13.87)
2n
di, j
− ei,u
2
(13.88)
Ezután következik a távolságmátrix átszámolása. Az i és j csúcsok kiesnek, helyükre kerül be az u csúcs. Az u csúcs és a többi csúcs közötti távolságot az alábbi képlettel határozzuk meg: dk,u
=
dk,i
+ dk, j − di, j 2
.
(13.89)
13.8. tétel. Ha a bemeno csúcsokon megadott d metrika additív metrika, akkor a S-
´ -´´ algoritmus visszaadja azt a fát, mely ezt a metrikát reprezentálja. adódóan pontosan egy fa létezik, amely ezt a metrikát ábráBizonyítás. A 13.7. tételbol zolja. Ha az algoritmusban az újonnan kiválasztott i és j csúcsokat ezen a fán csak egyetlen csúcs választja el, akkor egyszeru belso számolásból adódik, hogy a S ´ -´ ´ algoritmus helyesen jár el. Így elég azt bizonyítani, hogy a kiválasztott i és j csúcsok mindig a megadott módon helyezkednek el. csúcs választja el, akkor Eloször azt látjuk be, hogy ha i-t és j-t csak egyetlen egy belso bármely k-ra si, j deníciót, az si, j
< si,k és si, j < sk, j . Valóban, alkalmazva a (13.86) < si,k egyenlotlenséget átrendezve kapjuk, hogy
X (di, j
− di,l − d j,l ) − 2di, j −
(d j,k
− d j,m − dk,m ) + 2d j,k < 0
(13.90)
m, j,k
l,i, j
Amennyiben l
X
egyenletben szereplo
= m , i, j, k, a szummákból kapjuk, hogy (di, j
− di,l − d j,l ) − d j,k + d j,l + dk,l = 2dw,l − 2du,l < 0
(lásd még 13.7. ábra). A szummán kívüli tagok, valamint a szummán belül az l
(13.91)
= k és m = i
esetek pedig pontosan 0-ra összegzodnek, így bizonyítottuk, hogy a (13.90) egyenlotlenség fennáll.
571
13.5. Törzsfakészítés távolságon alapuló algoritmusokkal m
i
l
v
w m
m
j
k
13.8. ábra. Az m csúcsok lehetséges elhelyezkedése a fán.
Ezután a 13.8. tételt indirekt módon bizonyítjuk. Tegyük fel, hogy az i-t és j-t nem csúcs választja el, de si, j minimális. A fentiekbol következik, hogy sem iegyetlen belso csúcs választ el i-tol, illetve hez, sem j-hez nem található olyan csúcs, melyet csak egy belso Keressünk olyan k és l párt, melyet csak egyetlen w belso csúcs választ el, i-t w-vel j-tol. út és i-t j-vel összeköto út utolsó közös csúcsa pedig legyen v. si, j minimalitásából összeköto sk,l
− si, j > 0 .
(13.92)
Ezt átrendezve kapjuk, hogy
X (dk,l
− dm ,k − dm ,l ) − 2dk,l − 1
X (di, j
1
− dm ,i − dm ,k ) + 2di, j > 0 . 2
2
(13.93)
m 2 , i, j
m1 ,k ,l
= k, m1 = l, m2 = i és m2 = j esetek pontosan = m1 = m2 , i, j, k, l esetekben a kérdéses kifejezés
A szummákon kívüli tagok, valamint az m1 0-ra összegzodnek. A többi m
dk,l
− dm,k − dm,l − di, j + dm,i + dm,k .
(13.94)
úton kapcsolódik az i, j, k és l levelek által kifeszített részfához, Ha m az i-t j-vel összeköto akkor a (13.94) kifejezés mindig negatív lesz (lásd 13.8. ábra). Nevezzük ezen m csúcsokat I. esetnek. Ha m a v és w közötti úton kötodik be, akkor a (13.94) kifejezés lehet pozitív. Nevezzük ezen eseteket II. esetnek. Mivel a teljes kifejezésnek pozitívnak kell lennie, ezért adódik, hogy a II. esetek száma több kell, hogy legyen, mint az I. esetek száma.
0
úton van egy v csúcs, és ebbol kiindulva találunk Tudjuk, hogy az i-t v-vel összeköto
0
0
0 csúcs választ el. Ezekre megint a II. olyan k és l csúcsokat, melyeket csak egyetlen w belso esetek száma több kell, hogy legyen, mint az I. esetek száma, de ezzel ellentmondásra jutunk a k és l csúcsok esetével. Így i és j szomszédok kell, hogy legyenek, és ezzel bizonyítottuk a 13.8 tételt.
Gyakorlatok 13.5-1. Mutassuk meg, hogy ultrametrikában bármely három csúcsból származó három tá azonos, a harmadik pedig ezeknél kisebb. Bizonyítsuk volság vagy mind azonos, vagy ketto be az additív metrikák esetében a tetszoleges négy csúcsból származó távolságösszegekre fennálló analóg állítást is. 13.5-2. Mutassuk meg, hogy minden ultrametrika egyben additív metrika is. 13.5-3. Adjunk példát olyan metrikára, amely nem additív. 13.5-4. Mutassuk meg, hogy minden additív metrika euklideszi.
572
13. Bioinformatika
13.5-5. Adjuk meg a pontos képletet, amely a centroid módszer esetében meghatározza du,k -t di, j , di,k és d j,k segítségével. 13.5-6. Mutassuk meg, hogy a csúcsok számának négyzetével arányos idoben eldöntheto, hogy egy metrika additív-e, illetve ultrametrikus-e.
13.6. Válogatott témák Ebben a részben olyan témákkal foglalkozunk, amelyek általában nem szerepelnek bioinformatikai tankönyvekben, vagy csak vázlatosan vannak tárgyalva. Mi is csak a legfontosabb eredményeket említjük meg, és a tételeket nem bizonyítjuk.
13.6.1. Genomok átrendez®dése génekbol áll. A kétszálú DNS-nek csak az egyik szála Egy organizmus genomja különbözo a kódoló gén, a másik szál ennek a reverz komplementere. Mivel a DNS irányított, így egyetlen másolat található a beszélhetünk a gének irányítottságáról is. Ha minden génbol genomban, akkor a gének sorrendje leírható egy elojeles permutációként, ahol az elojel megadja a kódoló szál irányát. Ha adva van két genom azonos géntartalommal, elojeles permutációként ábrázolva, akkor a feladat az, hogy keressük meg azt a minimális mutációsorozatot, amely az egyik genomot a másikba transzformálja. Három mutációtípust különböztetünk meg:
•
Inverzió. Egy inverzió a genom egy darabját megfordítja. Az adott darabon a gének sorrendje, és a leolvasási irány, azaz az elojel is megváltozik.
•
Transzpozíció. Egy transzpozíció a genom egy darabját egy másik helyre teszi át, úgy, hogy a gének leolvasási iránya nem változik meg.
•
Invertált transzpozíció. Ennek hatására nem csak a genom egy darabjának a helyzete változik meg, de az elmozdított darab leolvasási iránya is megváltozik. Ha feltesszük, hogy csak inverziók történtek, akkor meg tudunk adni egy
Θ(n2 )
ideju
algoritmust, amely meghatároz egy olyan minimális mutációsorozatot, amely az egyik ge a szükséges mutációk száma nomot a másikba transzformálja, sot,
Θ(n) idoben eldöntheto,
ahol n a gének száma. Ha más, vagy többfajta mutációtípust veszünk gyelembe, akkor a probléma bonyolultsága nem ismert. Transzpozíciókra a legjobb közelítés egy 1.5-közelítés. Ha mind a három algoritmus. fajta mutációt gyelembe vesszük, akkor a legjobb eredmény egy 2-közelíto Ezenkívül súlyozott mutációkra létezik egy (1
+ )-közelítés
is, de a súlyok specialitása
miatt tudjuk, hogy egy legkisebb súlyú mutációsorozatban nem lesz invertált transzpozíció. Ha az elojeleket nem ismerjük, és csak inverziókat veszünk gyelembe, akkor a probléma bizonyítottan NP-teljes. Ugyanígy NP-teljes probléma az optimális inverziós medián megtalálása három elojeles permutáció esetében. Az optimális inverziós medián az az elo jeles permutáció, melynek a három elojeles permutációtól vett távolságainak az összege minimális. Az alábbiakban vázoljuk a két genom inverziós távolságának meghatározására szolgáló elméletet, az úgynevezett HannenhalliPevzner-elméletet. Ahelyett, hogy egy ciót transzformálnánk a
π2
permutációba, a
π−2 1 π1 -et
π1
permutá-
transzformáljuk az identikus permu-
573
13.6. Válogatott témák
0
2
1 -1
13.9. ábra. A
−1, +2, +5, +3, +4
3
4
+2
9
10 7
+5
8
+3
5
6
11
+4
elojeles permutáció ábrázolása nem elojeles permutációként, és a permutáció
töréspontgráfja.
tációba. Egyszeru csoportelméleti okoskodásból következik, hogy a két feladat egymással ekvivalens. Ezért feltesszük, hogy a két genomból a keresett tároztuk, a továbbiakban ezt
π-vel jelöljük.
π−2 1 π1 permutációt már megha-
Egy n elemu elojeles permutációt egy 2n hosszú elojel nélküli permutációval ábrázo-
+i-t lecserélünk egy 2i − 1, 2i párra, minden −i-t pedig egy − 1 párra. Ezenfelül az így kapott permutációt 0 és 2n + 1 közé keretezzük. Ezután el-
lunk a következoképen. Minden 2i, 2i
készítjük az úgynevezett töréspont-gráfot. Ennek csúcsai a nem elojeles permutáció elemei, beleértve a 0-t és a (2n + 1)-et is. A permutáció két elemét egy egyenes vonallal kötjük össze, ha a különbségük abszolútértéke nagyobb, mint egy. Valamint két csúcsot egy ívvel kötünk össze, ha egymás utáni számok, de a permutációban nem egymás után állnak. Egy példát adunk meg a 13.9. ábrán. Könnyen belátható, hogy a töréspont-gráfot egyértelmuen fel lehet bontani körökre, a körökben az egyenes élek és ívek felváltva jönnek. Egy kört irányítottnak hívunk, ha egy, a körön megtett séta során legalább egy egyenes élen balról jobbra, és legalább egy egyenes élen jobbról balra is haladtunk. Minden más kör irányítatlan. Két kör átfed, ha valamely íveik szükségképpen metszik egymást. A permutáció átfedési gráfjainak a csúcsai a töréspont-gráf körei, és két csúcs akkor van összekötve, ha a töréspont-gráfban a két kör metszi egymást. Az átfedési gráf komponensekre bomlik, egy komponens irányított, ha van benne irányított kör, egyébként irányítatlan. Az irányítatlan komponensek közül nem-gátaknak hívjuk azokat, amelyekre a töréspont-gráfon van két olyan irányítatlan komponens, amelyet az adott komponens elválaszt egymástól. Itt az el nem tudunk választáson azt értjük, hogy az egyik irányítatlan komponens valamely ívébol vonal felett úgy átmenni a másik irányítatlan komponens valamely a csúcsokat összeköto ívéhez, hogy ne metszenénk a nem-gát valamely ívét. A többi irányított komponenst gátnak hívjuk. A gátak közül szupergátaknak hívjuk azokat, amelyeket ha kitörlünk, akkor valamely amikor a nem-gát pontosan az adott nem-gát gáttá válik. Ez olyan esetekben fordul elo, Egy permutációt erodnek gátat választja el más nem-irányított komponensektol. hívunk, ha páratlan számú gátja van, és ezek mindegyike szupergát. 13.9. tétel. Legyen adva egy
π elojeles permutáció. Inverziók egy optimális sorozata, amely
ezt a permutációt rendezi, bπ
− cπ + hπ +
fπ
(13.95)
mutációból áll, ahol bπ a töréspont-gráfban az egyenes élek száma, cπ a töréspont-gráfban a körök száma, hπ a gátak száma, és fπ
= 1, ha π erod, egyébként pedig 0.
574
13. Bioinformatika
A tételt itt nem bizonyítjuk. mennyiséget meg lehet A (13.95) képletben szereplo
Θ(n) idoben határozni, ahol n az
elojeles permutáció mérete. Nyílván bπ és cπ kiszámolható O(n) idoben. A nehéz rész hπ és fπ kiszámolása. A problémát az okozza, hogy az átfedési gráfban az élek száma lehet
Ω(n2 ).
Ezért a gyors
algoritmus nem határozza meg a teljes átfedési gráfot, hanem csak minden komponensén részfát. egy feszíto
13.6.2. Sörétes-puska nukleinsavleolvasás Egy genom DNS-e általában milliós nagyságrendu, vagy még több nukleinsavból áll. Egy biokémiai technikával meghatározható a DNS egyik végén található nukleinsavak sorrendje, de a leolvasási bizonytalanság növekszik, ahogy haladunk a szekvenciában elore, és kb. 500 nukleinsav után a leolvasás teljesen bizonytalanná válik. számos kópiát Ezt a biokémiai problémát a következoképpen oldják meg. A DNS-bol vesznek, és ezek mindegyikét véletlen módon széttördelik olyan méretu részekre, melyet az részletekbol kell elobb leírt technikával aztán már meg lehet határozni. Ezek után az átfedo összerakni az eredeti hosszú szekvenciát. Ezt a technikát hívjuk sörétes-puska nukleinsavleolvasásnak, angolul shotgun sequencing-nek. Matematikailag úgy lehet deniálni a feladatot, hogy adott szekvenciáknak keressük a legrövidebb közös szuperszekvenciáját. Egy B szekvencia szuperszekvenciája A-nak, ha A részét részszekvenciája B-nek (részszekvencián egy szekvencia nem feltétlenül összefüggo értjük). Maier bebizonyította, hogy a legrövidebb szuperszekvencia NP-teljes probléma, ha az ábécé mérete legalább 5, és sejtése szerint ugyanez a helyzet a legalább háromelemu ábécék esetén is. Késobb megmutatták, hogy a feladat minden nem triviális ábécére NPteljes. Hasonló a legrövidebb közös szuperstring probléma, ami szintén NP-teljes (részstrin részét értjük). Ez utóbbi probléma az, ami igazán biológen egy szekvencia összefüggo stringeket keresünk. A megoldásra számos közelíto algoritgiailag érdekes, hiszen átfedo mus született. Egy mohó algoritmus minden stringpárra megkeresi a maximális átfedéseket, majd ezt próbálja mohó módon összefuzni egy legrövidebb szuperstringgé. Az algoritmus futási ideje O(Nm), ahol N a szekvenciák száma, m pedig a szekvenciák összhossza. Az így megtalált szuperstring mérete bizonyítottan kisebb, mint 4n, ahol n a legrövidebb szuper és a sejtés az, hogy string hossza. Egy továbbfejlesztett algoritmus bizonyítottan 3-közelíto, valójában sose kapunk 2n-nél hosszabb szuperstringet. A sörétes-puska nukleinsav-leolvasás során a nukleinsavak meghatározása nem tökéle tes, elofordulhatnak beszúrások, törlések és cserék is a meghatározás közben. Ezért Jiang közös szuperstring problémát. Kececioglu és Myers és Li javasolta a legrövidebb k-közelíto egy programcsomagot dolgozott ki, amelyben számos heurisztikus algoritmust megvalósítottak a probléma megoldására.
Gyakorlatok 13.6-1. Mutassuk meg, hogy ha egy permutáció erod, akkor legalább három szupergát van benne. kell egy erodnek 13.6-2. Legalább hány elembol állnia?
575
13. Feladatok
Feladatok 13-1. Konkáv SmithWaterman Adjuk meg a SmithWaterman algoritmust konkáv résbüntetésekre. 13-2. Konkáv Spouge Adjuk meg Spouge algoritmusát konkáv résbüntetésekre. 13-3. Kiszolgálás benzinkútnál Egy benzinkútnál két sorban állnak a kocsik. Mindegyik kocsit vagy gázolajjal vagy benzinnel kell kiszolgálni. Egyszerre legfeljebb két kocsit szolgálhatunk ki, de csak akkor, ha üzemanyagot igényel, és a két sor elso kocsijairól van szó, vagy vaa két kocsi különbözo két kocsijáról. Akár egy, akár két kocsit szolgálunk ki egyszerre, a két lamelyik sor elso folyamat kiszolgálási ideje ugyanakkora. Adjunk meg egy páros rejtett Markov-folyamatot, amelyre a Viterbi-algoritmus egy legrövidebb kiszolgálási tervet határoz meg. 13-4. Rejtett Markov-modellek momentumai Adott egy szekvencia és egy rejtett Markov-modell. Számoljuk ki a rejtett Markovmodellben az adott szekvenciát kibocsátó utak valószínuségének a várható értékét, varianciáját, k-adik momentumát. 13-5. Sztochasztikus környezetfüggetlen nyelvtanok momentumai Adott egy szekvencia és egy sztochasztikus környezetfüggetlen nyelvtan. Számoljuk ki az levezetések valószínuségeinek adott nyelvtanban a szekvenciát levezeto a várható értékét, varianciáját, k-adik momentumát. 13-6. Rejtett Markov-modellek együttes kibocsátási valószínusége 2
Ki lehet számolni ezt a valószínuséget O((n1 n2 ) ) idoben? 13-7. Rendezo inverziók inverzióknak hívjuk azokat az inverziókat, ameEgy adott elojeles permutációban rendezo lépései egy minimális hosszúságú rendezo sorozatnak. Hogyan változtathatja lyek kezdo inverzió a töréspont gráfban a körök, töréspontok és a gátak számát? meg egy rendezo
Megjegyzések a fejezethez Dinamikus programozási algoritmust biológiai szekvenciák hasonlóságára eloször Needle függvényre Waterman man és Wunch adott meg 1970-ben [344]. Tetszoleges résbünteto függvényekre és munkatársai adtak algoritmust [487]. Gotoh algoritmusa affin résbünteto függvény ötlete Watermantól származik 1982-ben jelent meg [165], a konkáv résbünteto [486], mellyel késobb Miller és Myers [332], valamint Galil és Giancarlo [332] foglalko függvény biológiailag helyesebb, zott. Bár empirikus adatok alapján a konkáv résbünteto függvényt használják, pl. a Clustal-W nevu mégis a leggyakrabban az affin résbünteto nép programban is [465]. szeru szekvenciailleszto A többszörös szekvenciaillesztés ötlete Sankofftól származik [411], mely a bioinformatika egyik központi feladata lett [182]. Bebizonyították, hogy a többszörös szekvenciaillesztés NP-teljes probléma [484], így a gyakorlatban heurisztikus módszereket alkalmaznak. A legelterjedtebb heurisztika az iteratív illesztés, ez alapján muködik a fent említett Clustal-W is. Hirschberg algoritmusát eloször leghosszabb közös részszekvencia megkeresésére
576
13. Bioinformatika
használták [207], de mára számos bioinformatikai algoritmusban szerepel, pl. Doublescan kimerítoen [324]. A szekvenciaillesztés további algoritmikai elemzésérol ír Guseld [182]. A sztochasztikus nyelvtanok és bioinformatikai alkalmazásuk a központi témája Durbin, Eddy, Krogh és Mitchison népszeru könyvének, melyet számos egyetem bioinformatika oktatásában alapkönyvként használnak [116]. Formális nyelvekkel, nyelvtanokkal foglalkozó magyar nyelvu tankönyv Bach Iván [25] és Fülöp Zoltán [131] muve, valamint [90]. Az osztályozó algoritmusok összehasonlításáról részletesen olvashatunk Podani János ok gyelkönyvében [374]. A logenetika és a logenetikai algoritmusok iránt érdeklod mébe ajánljuk Felsenstein [126], valamint Semple és Steel [424] könyveit. Kevéssé olvasmányos, de sok információt tartalmaz a genomátrendezodési algoritmusokról Pevzner könyve [368]. Stephen String searching címu könyvében részletesen foglalkozik a legrövidebb szu perstring problémájával. A könyvben számos kiváló referenciát és az algoritmusok részletes leírásait is megtaláljuk [437]. oknek Az alábbi megjegyzések a téma iránt kifejezetten érdeklod szólnak. Két string edit távolságán a minimális számú beszúrás-törlések számát értjük. Két string edit távolságának a kiszámolására van
Θ(l2 )-nél
gyorsabb módszer, amely a négy orosz közül csak egy gyorsítása néven híresült el, habár a négy egykori szovjetúnió-beli szerzo volt orosz nemzetiségu [18]. Az algoritmus futási ideje O(n
2
/ lg(n)),
azonban gyakorlati
alkalmazásokban eloforduló szekvenciahosszakra lassabb, mint a hagyományos dinamikus programozási algoritmusok. A leghosszabb közös részszekvenciára használt dinamikus programozási algoritmus a két szekvencia hosszainak szorzatával arányos idoben fut, hasonlóan a szekvenciák illesztéseire használt algoritmushoz. Hunt és Szymanski módszere ezzel szemben egy olyan gráfot melynek csúcsai a két összehasonlítandó szekvencia, A és B karakterei, és ai -t ponállít elo,
= b j . Ezt a gráfot használva létezik olyan algoritmus, Θ((r + n) lg(n)), ahol r a gráf éleinek a száma, n pedig a gráf csúcsainak
tosan akkor köti össze él b j -vel, ha ai melynek futási ideje
2
a száma, azaz a két szekvencia hossza [215]. Habár így az algoritmus futási ideje O(n lg n), számos alkalmazásban a behúzott élek száma a szekvenciák hosszával egyenesen arányos. O(n lg n) lesz, ami lényegesen jobb a kvadratikus ideju Ekkor a futási ido algoritmusnál. A saroklevágási technika egyik fejlett változata az úgynevezett diagonális kiterjesztés. A diagonális kiterjesztés a dinamikus programozási táblázatot átlós irányban tölti ki, és nem igényel tesztértéket. Ilyen algoritmusra példa Wu és munkatársainak az algoritmusa [501]. A Unix
diff utasításában használt algoritmus szintén diagonális kiterjesztésen alapul [331], + m + de2 ), ahol n és m a két összehasonlítandó
melynek az átlagos számolási ideje O(n
szekvencia hossza, de pedig a két szekvencia edit távolsága. algoritmus egy rövid P stringet keres meg egy A KnuthMorrisPratt stringkereso hosszú M stringben, és
Θ( p + m)
idoben fut, ahol p és m a két szekvencia hossza [261].
Landau és Vishkin módosított algoritmusa minden olyan illesztést megtalál M-ben, amely [277]. Az algoritmus futási ideje legfeljebb k helyen tér el P-tol riaigénye pedig
Θ(k( p lg( p) + m)), memó-
Θ(k( p + m)).
Bár a szekvenciaillesztésre legelterjedtebb algoritmusok dinamikus programozással muködnek, megadható szekvenciák optimális illesztése egész lineáris programozással is. Az ötlet Kececioglu és munkatársaitól származik [250]. A módszert kiterjesztették tetszoleges függvényre is [10]. Az egész értéku programozással kapcsolatos algoritmusokról résbünteto cikket Lancia [276]. A DiAlign szintén nem dinamikus programozáson alapul írt áttekinto
577
13. Megjegyzések a fejezethez
[337]. A szekvenciák strukturális illesztése csak a fehérjék három dimenziós szerkezetét veszi gyelembe. Olyan szekvenciaillesztést keresünk, melyben a réseket büntetjük, az összeillesztett karaktereket viszont nem hasonlóság vagy távolság alapján értékeljük, hanem az alapján, hogy a három dimenziós térszerkezetben az összeillesztett aminosavak mennyire hozhatóak fedésbe a szerkezetek forgatásával. Számos algoritmust dolgoztak ki strukturális szekvenciaillesztésre, ezek közül az egyik legnépszerubb a Kombinatorikus Kiterjesztés (CE) algoritmus [430]. Egy adott fa topológiára a Maximum Likelihood címkézés polinomiális idoben meg csomagba, a adható [378]. Ez az algoritmus az egyik legelterjedtebb logenetikai elemzo PAML-ba is bekerült (http://abacus.gene.ucl.ac.uk/software/paml.html). Egy adott fa topológia, élhosszak, szubsztitúciós modell és adott szekvenciák esetén lineáris idoben ki lehet számolni egy fa likelihoodját Felsenstein algoritmusával. A Maximum Likelihood fa problémája az, hogy adott modell és szekvenciák esetén határozzuk meg módon, még azt a fa topológiát és élhosszakat, amelyre a likelihood maximális. Meglepo senkinek sem sikerült bizonyítania, hogy ez a probléma NP-teljes lenne, bár ez a sejtés. Azt már sikerült bizonyítani, hogy az Ancestral Maximum Likelihood probléma, amikor nem csúcsok legvalószínubb csak a fa topológiáját és élhosszait, hanem a belso címkézését is keressük, NP-teljes [2]. szekvenciailleszto A két legelterjedtebb, rejtett Markov-modellek alapján muköd o programcsomag a SAM [213] és a HMMER (http://hmmer.wustl.edu/). Rejtett Markovmodell [364],
alapján páros
muköd o
rejtett
genomannotáló
Markov-modellt
programot
használ
fejlesztett
szintén
ki
Pedersen
genomannotálásra
a
és
Hein
Double-
Scan [324], (http://www.sanger.ac.uk/Software/analysis/doublescan/) és a Projector [325], (http://www.sanger.ac.uk/Software/analysis/projector/). Olyan rejtett Markov-modellt, amely evolúciós információk alapján határozza meg a kibocsátási valószínuségeket, Goldman, Thorne és Jones publikált eloször [157], fehérjék másodlagos térszerkezetének jóslására. Ez a rejtett Markov-modell szekvenciák illesztett oszlopait bocsátja ki, egy illesztett oszlop kibocsátási valószínuségét egy evolúciós fa és egy idofolytonos Markov-modell határozza meg. A kibocsátási valószínuséget Felsenstein algoritmusával lehet meghatározni. A Knudsen-Hein nyelvtant használja a PFold nevu program, amely RNS-ek másodlagos térszerkezetét határozza meg [257]. Ez a sztochasztikus környezetfüggetlen nyelvtan szintén illesztett szekvenciákat vezet le, a terminális szimbólumok ezen szekvenciaillesztés illesztett oszlopai. Az s terminális levezetési valószínuségét egy evolúciós törzsfa és egy idofolytonos Markov-modell határozza meg, a dFd levezetésben a két d terminális he lyére írandó két oszlop valószínuségét pedig ugyanezen a törzsfán egy olyan idofolytonos Markov-modell adja meg, melynek állapotai dinukleotidok. Az E algoritmus futási ideje négyzetesen növekszik a rejtett Markov-modell állapo tainak a számával. Azonban nem mindig ez a leghatékonyabb algoritmus. Egy biológiailag fontos többszörös rejtett Markov-modellben az E algoritmus futási ideje
Θ(5n Ln ), ahol
n a szekvenciák száma, L pedig a szekvenciák hosszának geometriai közepe. Meg lehet adni azonban egy olyan algoritmust, amely
Θ(2n Ln )
idoben kiszámolja a szekvenciák kibocsá-
tási valószínuségét [299, 300]. Nem ismert azonban, hogy erre a modellre a legvalószínubb kibocsátás megkeresésére hasonló gyorsítás megadható-e. Az RNS-ek Zuker-Tinoco [466] modellje térszerkezeti elemeken deniál szabadener-
578
13. Bioinformatika
giát, és egy adott másodlagos térszerkezethez a térszerkezet részeihez rendelt szabadenergiák összegét rendeli. A ZukerSankoff-algoritmus [513] sebb energiatartalmú másodlagos térszerkezetet,
Θ(l
2
Θ(l4 ) idoben találja meg a legki-
) memóriát használva, ahol l az RNS
szekvencia hossza. Ugyanilyen memória- és számolásigényu a térszerkezetek Boltzmaneloszlásához tartozó partíciófüggvény kiszámolása is [317]. Egy speciális esetben mind az optimális térszerkezet, mind a partíciófüggvény számolása felgyorsítható vábbra is
Θ(l
2
Θ(l3 ) idore is, to-
) memóriát használva [303].
a Az RNS-ek azon bázispárosodásait, melyben a párosodó nukleinsavakat összeköto, szekvencia felett haladó ívek metszik egymást, álcsomóknak hívjuk. Az álcsomókat tartalmazó térszerkezetek általános predikciója NP-teljes. Azonban bizonyos speciális álcsomók közül egy optimális álcsomó megkeresésére vannak polinomiális ideju algoritmusok [9, 302, 390, 471]. Rejtett Markov-modellek és sztochasztikus környezetfüggetlen nyelvtanok együttes kibocsátási valószínuségeinek meghatározásával foglalkoztak Jagota és munkatársai [226]. A keresett valószínuséget egy kvadratikus egyenletrendszer megoldásával lehet meghatározni, amelyet csak numerikusan lehet megoldani. Az egyenletrendszerben az ismeretlenek száma 2
V n , ahol V a nemterminálisok száma Chomsky féle normálformában, n pedig a rejtett megadtak egy iterációt, mely bizonyítottan konvergál a Markov-modell állapotai. A szerzok pontos megoldáshoz, egy iterációs lépés számolási igénye
Θ(V 3 n5 ). Az iteráció konvergen-
nem szolgálnak analitikus eredménnyel, de azt sejtik, hogy gyors. ciájának a sebességérol Sztochasztikus környezetfüggetlen nyelvtanok generátorfüggvényeit használta RNS térszerkezetek predikcióinak jóságára Markus Nebel. Számos olyan statisztikát sikerült analitikusan kiszámolnia, amelyek korrelálnak a predikció jóságával [343]. illeszRendezett fákhoz hasonlóan rendezett erdoket is lehet illeszteni. Rendezett erdok tésére adtak meg algoritmust Höchsmann és munkatársai. Megmutatták, hogy RNS térszer kezeteket lehet rendezett erdokkel ábrázolni, és ezen ábrázoláson keresztül az RNS térszerkezetek összehasonlíthatóak [197]. módszerek jóságára, és kimutatta, Atteson matematikai deníciót adott a törzsfakészíto hogy bizonyos deníciók alapján a S ´
´´ a leheto legjobb módszer [21].
Négy fajra három fa topológiát lehet készíteni, amelyeket quarteteknek hívunk. Ha egy az eredeti fa topológiáját is meg lehet fára ismerjük az összes quartet topológiát, akkor ebbol bebizonyították, hogy nem szükséges az összes quartetet megnézni, a közeli határozni. Sot fajok quartetjei is egyértelmuen meghatározzák a fa topológiáját [120]. Egy genom állhat több DNS szekvenciából, az egyes DNS szekvenciákat kromoszó máknak hívjuk. Genomátrendezodés során nem csak kromoszómán belül, hanem a kromoszómák között is keveredhetnek a gének. Ezekre az úgynevezett transzlokációs mutációkra adott meg
Θ(n3 ) ideju algoritmust Hannenhalli [192]. Transzlokációs átmérovel és a prob-
léma általánosításával foglalkozik Pisanti és Sagot [373]. A permutációk rendezésének általánosított problémája a minimális generáló szó kere permusése egy véges csoportban. Ez a probléma bizonyítottan NP-teljes [229]. Az elojeles tációk inverziókkal való rendezésén és a transzlokációs távolságon kívül csak egy biológiailag kevésbé releváns problémára van polinomiális ideju algoritmus, az úgynevezett blokk átrendezodésekre [76]. Érdekességként megjegyezzük, hogy a Microsoft tulajdonosa, Bill Gates is foglalkozott permutációk rendezésével, speciálisan a prex inverziókkal [150]. A könyvfejezetben csak a legfontosabb témákról írtunk, számos kevésbé fontos, de nagyon érdekes témakört kénytelenek voltunk kihagyni. Ilyen témakörök például a rekombi-
13. Megjegyzések a fejezethez
579
módszerek, a részleges emésztés, a náció, a pedigré elemzés, a karakteralapú törzsfakészíto fehérjecsavarás, DNS chipek, a tudásábrázolás, a biokémiai hálózatok. Ennek fényében Donald Knuth szavaival [112] zárjuk könyvfejezetünket:
It is hard for me to say condently that, after fty more years of explosive growth of computer science, there will still be a lot of fascinating unsolved problems at peoples' ngertips, that it won't be pretty much working on renements of well-explored things. Maybe all of the simple stuff and the really great stuff has been discovered. It may not be true, but I can't predict an unending growth. I can't be as condent about computer science as I can about biology. Biology easily has 500 years of exciting problems to work on, it's at that level.
14. Ember-gép kölcsönhatás
deníciót találjuk a témával kapcsolatban: Az interneten a következo
Az ember és számí tógép közötti együttmuködéssel foglalkozó tudományág az emberi használatra szánt interaktív számítógépes rendszerek tervezésével, megvalósításával és értékelésével, valamint e jelenségek tanulmányozásával foglalkozik. . . . E terület legfontosabb téma körül felmerülo vonatkozásai a következok:
• • •
Az emberek és gépek által elvégzett feladatok közös teljesítménye. Az ember és gép közötti kommunikáció szerkezete. A gépek használatára vonatkozó emberi képességek (például az interfészek tanulhatósága).
• • •
Az interfész programozása és algoritmusai. technikai kérdések. Az interfészek tervezésekor és kialakításakor felmerülo Az interfészek specikálásának, tervezésének és megvalósításának folyamata.
. . . Az ember és számítógép közötti együttmuködésnek a fentiek alapján vannak tudományos, technikai és tervezési kérdései. A fenti témák közül jó néhány csak távolról érinti a klasszikus értelemben vett algorit musok témakörét. Ezért ebben a fejezetben elsosorban olyan esetekre koncentrálunk majd, ahol a gépeknek nagy mennyiségu számítást kell elvégezniük, az emberek pedig egyfajta o és irányító szerepet töltenek be. intelligens ellenorz
14.1. Több választási lehet®séget kínáló rendszerek Az emberek képesek gondolkodni, érezni és érzékelni, és gyorsan tudnak alkalmazkodni egy új szituációhoz. Számolni is tudunk, de abban már nem vagyunk olyan jók. A számí tógépek ezzel szemben kiválók a számolásban, csak úgy falják a biteket és bájtokat. Ok azonban a számoláson kívül nem nagyon értenek máshoz, például meglehetosen rugalmat módon lanok. Ha az embernek és a számítógépnek a képességeit és erosségeit megfelelo kombináljuk, az nagyon hatásos teljesítményhez vezethet. Az ilyenfajta csapatmunkának az egyik lehetséges megközelítése az úgynevezett több választási lehetoséges optimalizálás. Egy ilyen több választási lehetoséget kínáló rendszer alternatívát kínál föl, mondjuk kettot, háresetén a számítógép néhány, könnyen áttekintheto döntést egy szakérto mat, vagy esetleg négyet, de semmiképpen sem sokkal többet. A végso
581
14.1. Több választási lehetoséget kínáló rendszerek
hozza meg a felkínált lehetoségek közül választva. Ennek a megközelítésnek egyik legfobb elonye, hogy az ember nincs hatalmas mennyiségu adattal elárasztva. A több választási lehetoséget kínáló rendszerek különösen hasznosak lehetnek azoknál ido áll rendelkezésre a teljes a valós ideju problémáknál, amikor alapjában véve elegendo megoldás kiszámolására, de a feladat bizonyos paraméterei ismeretlenek vagy fuzzy jelle guek. Ezek konkrét értékét csak egy meglehetosen kései idopontban tudjuk meg, amikor ido bonyolult számításokra. Képzeljük el, hogy a döntéshozó valamimár nincs elegendo lyen több választási lehetoséget adó algoritmus segítségével elore létrehozott néhány meg engedett megoldást. Majd amikor a tényleges adatok birtokába jut, valós idoben kiválaszt ezek közül egyet. Nézzünk egy példát, amelyben egy útvonalat kell megkeresnünk. Tegyük fel, hogy egy egy PC szoftver kamionsofornek az A pontból a Z-be kell eljutnia. Az út megkezdése elott utat, és kinyomtatja oket. segítségével megkeres két-három megfelelo Út közben a rádió információkat ad az aktuális forgalmi dugókról, illetve az idojárási problémákról. Ezekben a helyzetekben a kinyomtatott alternatívák segítenek a sofornek, hogy valós idoben egy másik útvonalat válasszon. alternatív megoldási lehetoségek A megfelelo megtalálása azonban nem is olyan egyszeru a számítógép segítségével. A legtermészetesebb megoldási módnak az tunhetne, ha valamilyen k-legjobb algoritmust alkalmaznánk. Ez azt jelenti, hogy adva van egy diszkrét optimalizálási probléma valamilyen célfüggvénnyel, és a k darab legjobb megoldást kell kiszámolni egy elore adott k-ra. Az ilyen k-legjobb megoldások azonban általában egymás minimális változtatásaiként jelennek meg, ahelyett, hogy valódi alternatívák lennének. A 14.1. ábra egy tipikus példát mutat erre. Egy 100
× 100 méretu diagramon az volt a
célunk, hogy rövid útvonalakat találjunk a bal alsó sarokból a jobb felsobe. Az élhosszak véletlen számok, amelyeket nem jelöltünk az ábrán. Az 1000 (!) legrövidebb utat számol Ha az tuk ki, és az ábra ezek unióját mutatja. A hasonlóság az egyes utak között feltun o. ábrát egy kicsit nagyobb távolságból nézzük, akkor az a benyomásunk támad, mintha azon csak egyetlen útvonal lenne, amit egy bozontos ceruzával rajzoltak. (A 14.2. pontban majd szintén a rövid alternatív útvonalak kiszámítása lesz az egyik legjobb példa.) Gyakran elofordul, hogy a
több választási lehetoség fogalmát egy másik értelemben több választási lehetoséges teszt értelemben. Ez a dolog teljesen mást jelent. A két fogalom közötti különbség a lehetséges megoldások típusában és számáhasználják, mégpedig a ban van:
•
A több választási lehetoséges teszt esetén a válaszok közül legalább egy mindig szakhelyes, a többi pedig lehet helyes vagy helytelen. A teszt készítoje (egy külso elore érto) megadja a kérdést, a lehetséges válaszokat, valamint azt, hogy mely válaszok helyesek.
•
hogy a lehetAz optimalizálási környezetben semmi nem világos elore. Elképzelheto, séges megoldások valamennyien megfeleloek, de az is elofordulhat, hogy mindannyian szakérto, aki megmondja az embernek, hogy a rosszak. És általában nincs olyan külso választása jó-e vagy sem. Emiatt a bizonytalanság miatt a legtöbb embernek szüksége van valamennyi kezdeti idore, hogy a több választást kínáló rendszeren belül a saját szerepét megismerje és elfogadja.
582
14. Ember-gép kölcsönhatás
14.1. ábra. 1000 legrövidebb út egy 100
× 100-as rács-gráfban, egymásra nyomtatott megjelenítésben.
14.1.1. Példák több választási lehet®séget kínáló rendszerre egyre népszerubbek 1. Rövid útvonalak. Az 1990-es évek elejétol lettek az útvonalválasz tásra megoldást kínáló PC-s programok. 1997-ben a holland AND nevu cég volt az elso, amelyik olyan programot árult, amelyik nem csak kiszámolta a legjobb (=legrövidebb vagy leggyorsabb) útvonalat, hanem egy vagy két alternatívát is megadott. A felhasználó nak lehetosége volt arra, hogy ezeket az alternatívákat egyszerre, illetve egyiket a másik után lássa. A felhasználó további paramétereket is megadhatott, amelyek az útvonalak vizuális második illetve harmadik legjobb tulajdonságait befolyásolták. Ilyen volt például az elso, útvonal színe, vastagsága stb. Az ezzel kapcsolatos munkák F. Berger nevéhez fuz odnek. fejlesztett ki egy módszert, amelynek segítségével lineáris struktúrák (pl. utak, vasutak, O folyók, . . . ) azonosíthatók szürkeárnyalatos muholdas felvételeken. Általában a lehetséges jelöltek nem egyediek, és Berger algoritmusa néhány további alternatív javaslatot is tartalmaz. Berger módszere a rövid alternatív útvonalakat generáló algoritmusokon alapul. 2. Utazóügynök probléma és lyukak fúrása nyomtatott áramköri lapokba. Az utazóügynök probléma esetén adva van N pont, és ismertek a pontok egymástól mért távolságai. A legrövidebb kör megtalálása. Errol a problémáról ismert, feladat egy minden pontot érinto, hogy NP-teljes. Ennek a feladatnak az egyik fontos alkalmazása az elektronikai iparban a lyukak fúrása nyomtatott áramköri lapokba. Ez esetben a pontoknak azok a helyek felelnek meg, ahová a lyukakat fúrni kell, és a cél a fúrófej mozgásának a minimalizálása. A gyakorlat azt mutatja, hogy ebben a feladatban nem csak a fúrófej mozgási útvonalának hossza az egyetlen feltétele a sikernek. Az útvonaltól függoen kisebb-nagyobb feszültsé útvonalak különbözo gek alakulhatnak ki a nyomtatott áramköri lapkában. A különbözo feszültségszinteket eredményeznek, amelyeket elore nem nagyon lehet kiszámítani. Ezért ki célszerunek tunik néhány alternatív, kelloen rövid útvonal meghatározása, amelyekbol tudjuk választani azt, amelyik a feszültség minimalizálása szempontjából a legjobb. motorok rengeteg 3. Internetes kereso motorok. A legtöbb esetben az internetes kereso találattal térnek vissza, amelyeket egy átlagos felhasználó nem tud, és nem is akar végig-
14.1. Több választási lehetoséget kínáló rendszerek
583
motorok tervezoi számára kulcsfontosságú feladat a megfelelo nézni. Ezért az ilyen kereso számú szabálynak tekintheto, hogy a kapott eredménybeli elso tíz kivonatok készítése. Elso találat legyen a leginkább a tárgyhoz tartozó, és legyen kelloen szétszórva az eredményhal mazon belül. Ezen a területen, és az e-kereskedelem területén a több választási lehetoséget kínáló rendszereket szokás tanácsadó rendszereknek is nevezni. 4. Bolygóközi urutak röppályái. A távoli bolygókra, kis bolygókra, és üstökösökre való urutazás a
high-tech kalandok körébe tartozik. Ezeknél a feladatoknál két kulcsfontos ságú tényezore kell tekintettel lenni. Az egyiket a költségvetési korlátok jelentik, a másik pedig az, hogy az urszondákat különlegesen nagy sebességre kell felgyorsítani, hogy idoben elérjék a céljukat. A rakéták felgyorsításában a gravitáció is segíthet, oly módon, hogy bolygókhoz egészen közel megy el a röppályájuk. Ezzel idot és üzemanyagot a közbeeso is lehet megtakarítani. Az utóbbi években ezek a gravitáció által segített röppályák egyre bonyolultabbak lettek, néha több bolygó-közeli elrepülést is tartalmaztak. A legjelentosebb példák a következok: a Cassini küldetése a Szaturnuszra a Vénusz-Vénusz-Föld-Jupiter sorozatot tartalmazta, a Rosetta küldetése a 67P/Hurjumov-Geraszimenko üstökösre a Föld Mars-Föld-Föld sorozatot, a Messenger küldetése a Merkúrra pedig a Föld-Vénusz-VénuszMerkúr-Merkúr sorozatot. A röppályák kiszámításának tudománya jelenleg abban tud segíteni, hogy egy korábban meghatározott útvonalat nomítson. Ehhez azonban a mérnökök fantázia és kreativitás segítségével ilyen elsodleges, nek megfelelo nomítható útvonalakat generálása kell tervezniük. Ezeknek az elsodleges útvonalaknak a számítógéppel történo még meglehetosen gyerekcipoben jár. kezdtek elterjedni a pia5. Számítógéppel támogatott sakk. Az 1970-es évek végétol con kapható sakkozó számítógépek. Ezeknek a gépeknek a játékereje fokozatosan növekszik, és ma már a legjobb PC-s programok egy szinten vannak a legjobb sakkozókkal. Az olyan csapatok azonban, amelyekben emberek és számítógépek is részt vesznek, eroseb illetve csak gépekbol álló csapatoknál is. E fejezet egyik szerzoje bek a csak emberekbol, (Althöfer) több kísérletet végzett több választási lehetoséget kínáló rendszerekkel. Az egyik sakkprogram fut két fügilyen összeállításban, amelyet 3-agynak nevezünk, két különbözo getlen PC-n. Mindkét program javasol egy lépést, amelyek közül egy (emberi) sakkjátékos hozza meg a végso döntést. Néhány kísérlet folyamán a 3-agy kitun teljeválaszt, vagyis o o sítményt ért el. A legfontosabb ezek közül egy 1997-es mérkozés volt, amelyben két, egyen pont alatti játékereju sakkjátékos (1900-as Élovel) ként 2550 Élo program, és egy amator számú német sakkjátékost, Juszupov nagymestert, akinek Élo pontja 5-3-ra legyozte az elso 2640 volt. Ezzel a 3-agy átlagos teljesítménye 2700 Élo-pont felettinek felelt meg. Ez után az esemény után a legjobb sakkjátékosok már valahogy nem nagyon akartak a 3-agy csa patok ellen küzdeni. A 3-agy erossége nagyrészt abban rejlik, hogy két különbözo sakkbeli tudás kombinálására ad lehetoséget. A számítógépek leginkább a taktikailag helyes lépések megtalálásában jeleskednek, míg az ember erossége a hosszú távú tervek kiválasztása. Manapság az összes pro sakkjátékos számítógépes programok segítségével készül a versenyekre, a megnyitásoknak és a partiknak valamilyen több választási lehetoséget kínáló elemzését felhasználva. Még kirívóbb a helyzet a levelezési sakkban, ahol a játékosok hivatalosan is felhasználhatják a számítógép segítségét a játszmáikban. 6. Nyaralási és utazási információk. Amikor valaki a nyaralását tervezi, általában összehasonlít néhány ajánlatot. Mindezt megteheti egy vasútállomáson, egy utazási irodában, ilyenkor nem vizsgálnak meg több ezer ajánvagy otthon az internetet böngészve. A vevok latot, hanem csak maximum tízet-húszat. Az életben számtalan (elfogadható és kevésbé
584
14. Ember-gép kölcsönhatás
elfogadható) stratégiával találkozhatunk, amelyekkel a cégek, szállodák és légitársaságok megpróbálják a termékeiket a legjobb ajánlatok közé pozicionálni. Egy gyakori példa erre, hogy néhány légitársaság hihetetlenül rövid utazási idovel teszi közzé az ajánlatát. Ennek az az egyetlen célja, hogy azokban a szoftverekben, amelyek az A pontból a B pontba történo szerint csökkeno sorrendben listázzák, az ajánlat a legelsok között szeutazásokat menetido számára, hogy az ilyen trükköket észrevegye, repeljen. Sok esetben nem is egyszeru a vevo mutatkozás. amelyeknek a célja a kivonatoló eljárásokban való minél sikeresebbnek tun o 7. RNS molekulák másodlagos térszerkezetének meghatározása. Az RNS molekulák másodlagos térszerkezetének meghatározása az egyik központi téma a számítógépes bioló gia területén. Az erre vonatkozó legjelentosebb algoritmusok a dinamikus programozáson alapulnak. Léteznek on-line adatbázisok, ahonnan valós idoben lehetséges megoldások kér le. hetok
Gyakorlatok 14.1-1. Szerezzünk gyakorlatot a több választási lehetoséget kínáló rendszerekben a FreeCell nevu türelemjáték segítségével. Töltsük le a BigBlackCell (BBC) nevu segédprogramot és ismerkedjünk meg a programmal. a http://www.minet.uni-jena.de/∼BigBlackCell/ címrol Némi gyakorlás után egy átlagos felhasználónak a BBC segítségével óránként legalább 60 FreeCell elofordulást kell megoldania.
14.2. Több lehetséges megoldás el®állítása 14.2.1. Lehetséges megoldások el®állítása heurisztikák és ismételt heurisztikák segítségével Nagyon sok optimalizálási probléma valóban nehéznek mondható, ilyenek például az NPteljes problémák. A pontos, de lassú eljárások, illetve a megbízhatatlan, de gyors heuriszti megoldásokat kák két lehetséges megközelítését adják annak, ahogyan pontos vagy közelíto találhatunk. Ha az a feladatunk, hogy néhány alternatív megoldást hozzunk létre, akkor a erényt kovácsolhatunk. Általában sokkal több jónak mondható megoldás van, szükségbol heurisztikák foleg mint ahány tökéletes, és a különbözo a véletlen elemeket is tartalmazók nem mindig ugyanazt a megoldást szolgáltatják. Ezért egy egyszeru stratégia lehet az, hogy egy vagy több heurisztikát többször alkalmazunk ugyanarra a problémára, és a kapott megoldásokat feljegyezzük. Létrehozhatunk pontosan annyi megoldást, amennyire szükségünk van, de létrehozhatunk többet is, amit az kivonatoló módszerrel javítunk. A kivonatok készítésénél alapveto tán majd egy megfelelo szóródása. Ami a szóródást illeti, ehhez szempont a minoség, és a megoldások megfelelo célszeru a lehetséges megoldások között valamilyen távolsági mértéket bevezetni, valamint klaszterezo algoritmusokat használni. megfelelo o futtatása Egyetlen heurisztika ismétlod A legtöbb esetben a heurisztika tartalmaz valamilyen mértéku véletlent. Ez esetben nincs más teendonk, mint, hogy a heurisztikát egymástól függetlenül többször lefuttassuk, amíg számú különbözo megoldást kapunk. Az alábbiakban az utazóügynök problémán fogkello heurisztikára és a beszúró juk bemutatni ezt a megközelítést. Adunk egy példát a cserélo
14.2. Több lehetséges megoldás eloállítása
585
heurisztikára, és mindkét esetben rámutatunk a véletlen elemek szerepére. Amennyiben a pontok közötti d(i, j) távolság szimmetrikus, akkor a lokális keresés cserével egy jól ismert cserélo heurisztika. Az alábbi pszeudokódban T ( p) jelöli a T kettos vektor p-edik komponensét. L - (N, d) ´ ´ -- ´ - ¨ ¨ - ´ ´
= (i1 , i2 , . . . , iN ) ≤ p < q ≤ N és q ≥ p + 2, és d(T ( p), T ( p + 1)) + d(T (q), T (q + 1)) > d(T ( p), T (q)) + d(T ( p + 1), T (q + 1)) (A q = N speciális esetben vegyük a q + 1 = 1-et.) do T ← (i1 , . . . , i p , iq , iq−1 , . . . , i p+1 , iq+1 , . . . , iN )
1
generáljunk egy kezdeti véletlen útvonalat T
2
while létezik olyan p és q index, amelyekre 1
3 4
számoljuk ki a T útvonal hosszát, l-et
5
return T , l Ebben a heurisztikában a véletlen elemeket a kezdeti útvonal kiválasztása, valamint az
beállítások a sorrend jelenti, ahogyan az élpárokat megvizsgáljuk a 2. lépésben. Különbözo lokális minimumhoz vezetnek. Nagy méretu különbözo problémák esetén, például 1000 véletlen pontot véve az egység oldalú négyzetben, az Euklideszi távolságot gyelembe véve, ha 100 független futtatás majdnem 100 különbözo lokális teljesen normálisnak tekintheto, minimumhoz vezet. Az alábbi pszeudokód egy szabványos beszúró heurisztikát mutat be. B (N, d) ´ ´ -- ´ - ¨ ¨ - ´ ´ 1
generáljuk a (i1 , i2 , . . . , iN ) véletlen permutációt az {1, 2, . . . , N } elemekbol
2
T
3
for t
4
← (i1 , i2 ) ← 2 to N − 1 do keressük meg a d(T (r), it+1 )
+ d(it+1 , T (r + 1)) − d(T (r), T (r + 1)) minimumát ∈ {1, . . . , t}. (r = t esetén r + 1 = 1) legyen a minimum r = s-ben T ← (T (1), . . . , T (s), it+1 , T (s + 1), . . . , T (t)) ahol r
5 6
számoljuk ki a T útvonal hosszát, l-et
7
return T , l Így eljárva az elemeket egyesével szúrjuk be oly módon, hogy a beszúrás után a leheto
legkisebb legyen az új útvonalhossz. cserénél, a különItt a véletlen elem az N pont permutációja. Hasonlóan, mint a kettos beállítások különbözo lokális minimumhoz vezetnek. További véletlen elemet jelentbözo het, ha valamelyik lépésben az optimális beszúrás helye nem egyértelmu. Néhány modern heurisztika a természettel való hasonlóságon alapul. Ilyen esetekben a felhasználónak még több lehetosége van. A szimulált hokezelés esetén néhány köztes megoldást kaphatunk az egyes futtatásokból. Vagy egy genetikus algoritmus egyes futásaiból generációkat reprezentálhatnak, is kaphatunk néhány megoldást, amelyek akár különbözo akár egy kiválasztott generáció többszörös megoldásait. heurisztikák ismételt futtatására egy speciális technikát jelent a lokális opA cserélo timumok perturbálása. Eloször lefuttatjuk az eljárást egy lokális optimum megtalálására. Ezután ezen az optimumon véletlenszeru lokális változtatásokat végzünk. Az így kapott
586
14. Ember-gép kölcsönhatás
megoldásból kiindulva újra elindítunk egy lokális keresést, ami egy második lokális optimumhoz vezet. Ezen ismét véletlenszeru változtatásokat végzünk, és így tovább. A véletlenszeru változtatások mértéke azt fogja befolyásolni, hogy a lokális optimumok sorozata egymástól. mennyire lesz különbözo Még a determinisztikus heurisztikák alkalmazása esetén is vannak esetek, amikor több lehetséges megoldást kaphatunk. A holtversenyes esetekben például a választástól függoen más-más eredményre jutunk, vagy a számolás pontossága (a kerekítési szabályok) is oko módszereket, amelyekben a zóhat ilyesmit. A 14.2.6. pontban tárgyaljuk azokat a bünteto o paramétereket mesterségesen megváltoztatjuk (pl. növeljük az élhosszakat) az ismétlod futtatások során. Az úgynevezett tetszoleges futási ideju algoritmusokban, mint például a keresési fa iteratív mélyítése, a köztes megoldások használhatók fel alternatív jelöltekként. heurisztikák alkalmazásával A lehetséges megoldások összegyujtése különbözo Ha ugyanarra a problémára több heurisztika is ismeretes, akkor mindegyikük szolgáltathat egy vagy több megoldásjelöltet. A 14.1.1. pont 5. részében ismertetett 3-agy összeállítás egy jó példája a több választást kínáló rendszereknek, amelyek több program futását használják gépeken is futnak. (A fel. Az ott említett két program független egymástól, és különbözo versenysakkot szigorú idokorlátok keretei között játsszák, ahol 3 perc jut egy lépésre. Ha a két programot egy gépen futtatnánk multitaszk üzemmódban, azzal számítási eroforrásokat veszítenénk, és ez Heinz szerint körülbelül 60-80 Élo-pontba kerülne.) A 3-agy kongurációnál használt sakkprogramok normális, megvásárolható programok, nem olyanok, amiket speciálisan a több választást kínáló rendszer számára terveztek. Minden program tartalmazhat hibákat. A független programokat használó, több válasz tási lehetoséget kínáló rendszerek egy nyilvánvaló elonnyel rendelkeznek a katasztrofális hibák tekintetében. Ha két független programot futtatunk, amelyek mindegyikénél p a katasztrofális hiba bekövetkezésének a valószínusége, akkor az együttes bekövetkezés valószínu 2
o szerepet betölto ember általában észre fogja venni, amisége p -re csökken. Egy ellenorz kor a megoldásjelöltek katasztrofális hibát tartalmaznak. Ezért az az eset, amikor az egyik megoldás normális, a másik pedig katasztrofális (ennek valószínusége egyébként 2 p( p − 1)) nem fog hibához vezetni. Egy további elonyt jelent még, hogy ilyenkor a programoknak nem kell valamiféle k-legjobb vagy k-választást megvalósító módszert tartalmazniuk. A gépek által kínált egybevágó javaslatokat lehet úgy tekinteni, mint annak a jelét, hogy az adott megoldás éppen megfelelo. A független programokat használó, több választási lehetoséget kínáló rendszereknek azonban vannak gyenge pontjai is:
•
tudásbeli különbség van, akkor a döntést hozó személy Ha a programok között jelentos nehezen fogja rászánni magát, hogy a gyengébb gép megoldását válassza.
•
programok javaslatai egymással inkompaTöbb lépéses muveletek esetén a különbözo tibilisek lehetnek.
•
és a futtatott programoktól függoen, Gyakran elofordul, hogy az operációs rendszertol egy PC nem elég stabilan muködik multitaszk üzemmódban. És természetesen az sem mindig biztosított, hogy a programok valóban függetlenek
egymástól. Az 1990-es évek végén például Németországban számos közúti útvonaltervezo nevekkel és interfészekkel. Valójában azonban mindegyik program volt kapható különbözo négy független program kernel és adatbázis valamelyikén alapult.
587
14.2. Több lehetséges megoldás eloállítása
14.2.2. Büntet® módszer egzakt algoritmusokkal megoldások megtalálására az úgyValamivel jobban kézben tartott módot ad a szóba jövo példán kenevezett bünteto módszer. Ennek a módszernek az alapötletét az útvonaltervezo útvonalból és keressünk resztül illusztráljuk. Induljunk ki egy R1 optimális (vagy megfelelo) legjobban kielégíti az alábbi két feltételt. egy R2 alternatív megoldást, amelyik a leheto (i)
esetben nincs R2 -nek megfelelonek kell lennie a célfüggvény szempontjából. Ellenkezo értelme, hogy R2 -t válasszuk. A példánknál maradva, most az útvonal hossza az elsodleges cél.
esetben nem (ii) R2 -nek nem szabad nagyon hasonlítania az eredeti megoldásra. Ellenkezo beszélhetünk valódi alternatíváról. Az úgynevezett mikro mutációk esetén nagy az esélye annak, hogy az összes egymáshoz hasonló megoldásjelölt ugyanazzal a gyenge ponttal rendelkezik. A példánkban a
hasonlóság mérésére alkalmas lehet az R1 -ben és R2 -ben is megtalálható közös részek hossza. Ez azt jelenti, hogy R2 -nek rövidnek kell lennie, de emellett R1 -gyel kevés közös részének kell lennie. E cél elérése érdekében két célfüggvény kombinációját fogjuk használni. Az egyik az útvonal hossza, a másik a közös részek hossza. Ezt úgy fogjuk elérni, hogy az R1 -beli szakaszokat büntetni fogjuk, és ennek a módosított legrövidebb útvonal problémá nak keressük az R2 megoldását. A büntetés mértékének változtatásával különbözoképpen súlyozhatjuk az (i) és (ii) feltételeket. Az egyik legegyszerubb megközelítés az, amikor egy relatív bünteto tényezot használunk. Ez azt jelenti, hogy az R1 -hez tartozó szakaszok hosszát megszorozzuk 1
+ ε-nal.
B - -´- -´ (G , s, t, ε) ¨ ´ ¨ 1
t-be vezeto R1 legrövidebb utat a G keressük meg az s-bol
2
for
3
∀e ∈
= (V, E , w) súlyozott gráfban
E
do if e R1 -hez tartozik
4
b(e) then w
5
b(e) else w
← w(e) · (1 + ε) ← w(e)
6
b = (V, E , w t-be vezeto R2 legrövidebb utat a G b) módosított gráfban keressük meg az s-bol
7
számítsuk ki az R2 módosítás nélküli w(R2 ) hosszát
8
return (R1 , R2 ) és (w(R1 ), w(R2 )) Tekintsük az alábbi példát.
14.1. példa. Adott egy G
= (V, E) gráf súlyozott élhosszakkal. A 14.2. ábrán az élek hosszát a melléjük
T -be vezeto legrövidebb út PD , amelynek hossza 23, és a következo írt számok jelzik. Az S -bol csúcsokat érinti: S - A - C - D - F - T . Ha a PD éleinek hosszát megszorozzuk 1.1-del, és megoldjuk a kapott legrövidebb út problémát, akkor a P B útvonalat kapjuk, amelynek módosított hossza 25, eredeti csúcsokat érinti: S - A - B - F - T . P B és PD közös részei az S - A és F hossza 23.7, és a következo T szakaszok, amelyeknek összhossza 13.
ε méretét mindig a körülményeknek megfeleloen kell megválasztani. Az AND cég pi programjában a legrövidebb útvonal minden szakaszát 1.2-vel acon kapható útvonaltervezo szorozták meg, vagyis
ε = 0.2. Az alternatív útvonal ezek alapján kerül kiszámításra. Ber-
lineáris struktúrák (utcák, folyók, reptéri ger munkájában a muholdas felvételeken szereplo
588
14. Ember-gép kölcsönhatás
8.7 A 9
B 8
2 1
S
C
1
D
1.1
4
1
9
F
T
8
E 9 G
H
14.2. ábra. A14.1., 14.2. és 14.6. példákhoz tartozó gráf.
kifutópályák) felismerése szintén a legrövidebb útvonal módszerrel történik. Itt
ε =
1.0
választásnak, ami érdekes alternatív megoldásokat adott. bizonyult megfelelo tényezo helyett használhatunk additív bünteto A relatív bünteto tagot is. Ez azt jelenti, hogy minden olyan élhez, amelyet büntetni szeretnénk, hozzáadunk egy konstans
ε-t.
A fenti algoritmusban ekkor csupán a 4. lépést kell megváltoztatnunk az alábbira.
∗
b(e) then w
4
← w(e) + ε
14.2. példa. Adott a 14.1. példából már ismert G
=
T -be (V, E) gráf (lásd a 14.2. ábrán). Az S -bol
legrövidebb út most is PD , amelynek hossza 23, és amely a következo csúcsokat érinti: S - A vezeto - C - D - F - T . Ha a PD éleihez hozzáadunk 0.1-et és megoldjuk a kapott legrövidebb út problémát, akkor a PE útvonalat kapjuk, amelynek módosított hossza 23.4, eredeti hossza 23.1, és a következo csúcsokat érinti: S - A - C - E - F - T . PD -nek és PE -nek három közös éle van.
tag nem rosszabb a relatívnál. Az utóbbinak, a mulAlapjában véve az additív bünteto tiplikatívnak azonban megvan az az elonye, hogy nem érzékeny az élek mesterséges kettévágására. módszerek általánosításához hasznos a következo deníció. A bünteto 14.1. deníció (összeg típusú optimalizálási probléma).
Legyen E egy tetszoleges véges
halmaz, S pedig egy E részhalmazaiból álló halmaz. E-t alaphalmaznak nevezzük, S elemeit pedig E megengedett részhalmazainak. Legyen w : E vény az E-n. Minden B
∈ S -re legyen w(B) =
P
e∈ B
→ R egy valós értéku súlyfügg-
w(e).
A min w(B) optimalizálási problémát összeg típusú optimalizálási problémának, vagy B∈S
röviden csak
P
-típusú problémának nevezzük.
Megjegyzések. 1. 2.
A B
∈S
elemeket szokás megengedett megoldásoknak is nevezni.
Minden maximalizálási probléma átalakítható minimalizálási problémává ha w-t vel helyettesítjük. Ezért a maximalizálási problémákat is nevezni.
P
−w-
-típusú problémának fogjuk
589
14.2. Több lehetséges megoldás eloállítása
14.2.3. Példák
P
-típusú problémákra
•
Legrövidebb út probléma
•
Hozzárendelési probléma
•
Utazóügynök probléma
•
Hátizsák probléma
•
Sorozat csoportosítási probléma
14.3. példa. Tekintsük a hátizsák problémát. Adott egy I = { I1 , I2 , . . . , In } elemhalmaz, egy w : I → R+ súlyfüggvény, egy v : I → R+ értékfüggvény és a hátizsák kapacitása C. A feladat az, hogy határozzuk meg azt a legértékesebb elemhalmazt, amelyek összsúlya nem haladja meg a hátizsák kapacitását. Ha I-t tekintjük alaphalmaznak, S pedig azon részhalmazok összessége, amelyek összsúlya ki mint C, akkor egy sebb vagy egyenlo, B
P
-típusú problémához jutunk. Maximalizálnunk kell v(B)-t
∈ S -re.
P 14.2.4. A büntet® módszer absztrakt megfogalmazása -típusú problémákra módszer). Legyen E egy tetszoleges 14.2. deníció (bünteto halmaz, S pedig álljon E megengedett részhalmazaiból. Legyen w : E
→ R egy valós értéku,
p : E
→ R≥0 pedig egy nem
negatív valós értéku függvény az E-n. Minden
ε > 0-ra legyen Bε egy optimális megoldása a min fε (B), B∈S
problémának, ahol fε (B) := w(B)
+ ε · p(B) .
Egy olyan algoritmussal, amelyik képes a büntetés nélküli min w(B) problémát megolB∈S
dani, megtalálhatjuk Bε megoldásait is. Ehhez csak a w függvényt kell módosítanunk, oly módon, hogy minden e
∈
melletti megoldásnak vagy
E-re w(e)-t helyettesítjük w(e)
+ε·
p(e) -vel. Bε -t
ε -büntetés
ε -alternatívának nevezzük. .
Deniáljuk ezen kívül B∞ -t, mint a következo probléma megoldását:
lex min ( p(B), w(B)) B∈S
(minimalizálás a lexikograkus sorrendnek megfeleloen) ,
amely a minimális p(B) értékkel rendelkezik, és az ilyen megoldások között minimális w(B) értékkel. Megjegyzés. Amennyiben w és p is pozitív, valós értéku függvények, ekkor egyfajta szim-
∗
ε-büntetés melletti < ε < ∞) a (w, p) függvénypárra nézve, ha B∗ (1/ε) büntetés melletti megoldás
metria áll fenn az optimális megoldások körében: B pontosan akkor lesz megoldás (0
a ( p, w) függvénypárra nézve.
590
14. Ember-gép kölcsönhatás
A szimmetria megorzése miatt van értelme deniálni B0 -t, ami optimális megoldása a problémának: következo lex min (w(B), p(B)) B∈S
.
Ez azt jelenti, hogy B0 nem csak optimális megoldás a w célfüggvényre nézve, hanem az ilyen megoldások között a minimális p értékkel rendelkezik. 14.4. példa. Adjuk meg a formális denícióját a 14.1. példának ebben az absztrakt
P
-típusú meg-
T -be vezeto PD legrövidebb utat, és keresünk egy alternatív, jó fogalmazásban. Ismerjük az S -bol függvényt a következoképpen megoldást. A p bünteto deniáljuk:
w(e), p(e) = 0
ha e egyik éle a PD legrövidebb útnak
,
egyébként .
Büntetés melletti megoldások keresése az összes Gyakran elore nem látható, hogy mely
ε
ε ≥ 0 paraméterre
paraméter mellett kapunk használható alternatív
megoldásokat. Egy oszd meg és uralkodj jellegu algoritmussal megtalálhatjuk az összes olyan megoldást, amelyik valamely ε-ra eloállna. Véges S halmazokra megadunk egy hatékony algoritmust, amelyik egy viszonylag kicsi
B⊆S •
tulajdonságokkal rendelkezo halmazt állít elo: megoldásokból álló, a következo
minden B
∈ B
elemre létezik olyan
ε ∈ R+ ∪ {∞},
hogy B optimális megoldás az
ε
elem, hogy B optimális megoldás az
ε
paraméter mellett; bünteto
•
minden
ε ∈ R+ ∪ {∞}-re
létezik olyan B
∈ B
paraméter mellett; bünteto
•
B a fenti két tulajdonsággal rendelkezo összes halmazrendszer közül a minimális elemszámmal rendelkezik. paraméter mellett optimális, Egy olyan B megoldást, amelyik legalább egy bünteto
algoritmus büntetés-optimális megoldásokbüntetés-optimálisnak nevezünk. A következo nak egy olyan halmazát keresi meg, amelyek minden
ε ∈ R+ ∪ {∞}-t lefednek.
B halmaz elemeit rögzített sorrendben ad= ε(1) < ε(2) < · · · < ε(k) = ∞. Az algoritmusnak ellenoriznie kell, hogy ε(i) < ε(i + 1) esetén ne létezzen olyan köztes ε, ε(i) < ε < ε(i + 1), Az egyszerubb azonosíthatóság kedvéért a
juk meg (Bε(1) , Bε(2) , . . . , Bε(k) ), ahol 0
paraméterre sem Bε(i) sem Bε(i+1) nem optimális. Ellenkezo esetben az hogy erre a bünteto algoritmusnak azonosítania kell legalább egy ilyen
ε-t, és keresnie kell egy ε-büntetés mel-
letti Bε megoldást. Az alábbi pszeudokód 11. lépésében a Border[i] változót akkor állítjuk 1-re, ha kiderül, hogy nem létezik ilyen köztes
ε.
Az alábbiakban látható a pszeudokód, amelyhez néhány megjegyzést is fuztünk. Algoritmus büntetés-optimális megoldások olyan lyek minden
ε ≥ 0-ra lefedik a következo problémát: min fε (B) B∈S
ahol fε (B)
= w(B) + ε · p(B).
B
sorozatának megtalálására, ame-
591
14.2. Több lehetséges megoldás eloállítása O--´ --(w, p) 1
legkisebb számítsuk ki azt a B0 -at, amelyik minimalizálja w(B)-t és p(B)-értéke a leheto
2
legkisebb számítsuk ki azt a B∞ -t, amelyik minimalizálja p(B)-t és w(B)-értéke a leheto
3
if ( p(B0 )
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
= p(B∞ )) B ← { B0 } E ← (0) Border← ∅ B B0 minimalizálja a w és p függvényeket és minden ε-ra optimális else do k ← 2 E = (ε(1), ε(2)) ← (0, ∞) Border[1] ← 0 B ← (B0 , B∞ ) while van olyan i ∈ {1, 2, . . . , k − 1} hogy Border[i] = 0. do ε ← (w(Bε(i+1) ) − w(Bε(i) ))/( p(Bε(i) ) − p(Bε(i+1) )) keressünk egy optimális Bε megoldást a ε paraméterhez if fε (Bε ) = fε (Bε(i) ) = fε (Bε(i+1) ) then Border[i] ← 1 else do B ← (Bε(1) , . . . , Bε(i) , Bε , Bε(i+1) , . . . , Bε(k) ) E ← (ε(1), . . . , ε(i), ε, ε(i + 1), . . . , ε(k)) Border ← (Border[1], . . . , Border[i], 0, Border[i + 1], . . . , Border[k − 1] k ← k+1 return B, E, Border then do
Az algoritmus végén
B
büntetés-optimális megoldások sorozata lesz, az különbözo
E
vektor pedig egymás utáni epszilonokat fog tartalmazni. tulajdonságokon alapul: A fenti algoritmus a következo
ε-optimális megoldás, akkor létezik olyan IB = [εl , εh ] intervallum (εl , εh ∈ R ∪ {∞}), hogy B optimális minden ε ∈ IB paraméterre, más paraméterre viszont nem
(1) Ha B egy
optimális.
0
B és B megoldásra, és a hozzájuk tartozó nem üres I B és I B0 intervallu(2) Két különbözo három eset valamelyike fordulhat elo. mokra csak a következo
∗ ∗ ∗
IB
=
I B0 . Ez pontosan akkor igaz ha w(B)
= w(B0 ) és
p(B)
=
0
p(B ).
I B és I B0 diszjunktak. IB
∩ IB0 = {ε},
vagyis a metszet egyetlen epszilont tartalmaz. Ez az eset akkor áll
fenn, ha I B és I B0 szomszédos intervallumok. Az E halmaz végessége miatt csak véges sok B
∈
S megengedett megoldás létezik.
és (2)-bol következik, Ezért csak véges sok optimalitási intervallum lehet. Így (1)-bol halmazára: hogy a [0, ∞] intervallumot fel tudjuk osztani intervallumoknak a következo
{[0 = ε1 , ε2 ], [ε2 , ε3 ], . . . , [εk , εk+1 = ∞]}.
Minden intervallumra vonatkozóan külön-
B megoldásokat kapunk, amelyek optimálisak az intervallumbeli összes bözo
ε-ra. Az
ilyen megoldást az intervallum reprezentánsának nevezzük. (3) Az algoritmus célja, hogy ezeknek az optimalitási intervallumoknak a határait megtalálja, és minden intervallumra találjon egy reprezentáns megoldást. Az iteráció minden
592
14. Ember-gép kölcsönhatás
lépésében vagy egy új intervallum reprezentánsát, vagy két intervallum között egy új határt találunk meg (7-13 lépések). Ha k darab optimalitási intervallumunk van, ahol k
≥
2k 2, akkor elegendo
−1
darab min w(B) B∈S
+ε·
p(B) típusú problémát megoldani,
hogy valamennyit megvizsgáljuk, és megtaláljuk a reprezentáns megoldásokat.
Az
ε-alternatívák unimodalitási tulajdonsága ε-alternatívát számolunk
Amennyiben csak egy
ki, felmerül a kérdés, hogy milyen bün-
paramétert használjunk, hogy a teto
legjobb alternatív megoldáshoz jussunk. Ha leheto paraméter túl kicsi, az optimális és az alternatív megoldás túlságosan hasonló a bünteto egymáshoz, és ez nem ad valódi választási lehetoséget. Ha a paraméter túl nagy, az alternatív megoldás túlságosan gyenge lesz. A legjobb választásnak az tunik, ha útvonaltervezo példában. választunk. Ezt fogjuk illusztrálni a következo, 14.5. példa.
közepes
ε-t
és végpont közötti útvonalat kell megterveznünk. Tegyük fel, hogy egy adott kezdo
Ismerjük az átlagos utazási idoket minden szakaszra vonatkozóan, és két útvonalat tervezhetünk. Az utolsó pillanatban ismerjük meg a tényleges utazási idoket, és ekkor választhatjuk ki a gyorsabbat a két jelöltünk közül. útvonal az, amelyik az átlagos utazási idok alapján a leggyorsabb, a második pedig Legyen az elso módszer szerint találtunk. A kérdés az, hogy milyen bünteto paramétert egy olyan, amit a bünteto használjunk, hogy a gyorsabb út tényleges utazási idejét minimalizálni tudjuk Konkrétan, vegyünk véletlenszeruen generált példákat a legrövidebb útvonal problémára egy 25
×
25-ös méretu súlyozott, irányított, rácsos G
=
(V, E , w) gráfban. Az élek súlyainak elosz-
lása legyen egyenletes a [0, 1] intervallumban. Kiszámoljuk a bal alsó sarokból a jobb felsobe ve minimális súlyú P0 útvonalat. Ezután oly módon büntetjük a P0 éleit, hogy megszorozzuk zeto, . . . , Pε -et, + ε-nal, és kiszámolunk egy sor ε-büntetés melletti megoldást Pε -et, Pε -ot, ε = 0.025, 0.050, . . . , 0.750-re. Így 30 megoldás párt kapunk, {S 0 , S ε }, {S 0 , S ε }, . . . , {S 0 , S ε }-at,
azokat 1
1
1
2
2
30
30
ezeket tudjuk összehasonlítani. Az élek w(e) súlya a késedelem nélküli, átlagos utazási idot jelöli, vagyis azt a minimális idot, amire forgalmi dugó nélkül az adott útszakaszon szükség van. Az élre vonatkozó w(e) tényleges utazási ettol a következoképpen ido térhet el:
λc (e) · w(e) = egymástól függetlenül minden élre. Itt a
, , − p valószínuséggel
w(e):
p valószínuséggel
w(e):
1
λc (e) számok egymástól független véletlen számok, amelyek ≤ p ≤ 1 paramétert hiba valószínuségnek, a
egyenletesen oszlanak el az [1, c] intervallumban. A 0 c
≥ 1 paramétert pedig hiba szélességnek nevezzük. Minden {S 0 , S ε } párra kiszámoljuk a w(S 0 ) és w(S ε ) függvények minimumát. Azért, hogy jobi
i
ban érzékeljük annak elonyét, hogy két választási lehetoségünk van egy helyett, képezzük az elobbi értéknek az S 0 optimális megoldás értékével vett hányadosát.
φε = i
min{w(S 0 ), w(S εi )} w(S 0)
(i
= 1, . . . , 30).
φε értékeket 100,000 véletlenszeruen generált 25 × 25-ös rácsos gráfra, ahol a hiba = 0.1 volt, a hibaszélesség pedig c = 8. A 14.3. ábrán a φε átlagos értékeit láthatjuk ε1 = 0.025, ε2 = 0.050, . . . , ε30 = 0.750-re. unimodális ε-ra nézve. Amint az a 14.3. ábrán is látható, a megoldás párok φε várható minosége ∗ ε-ra. Ebben a példában ε ≈ 0.175 Ez azt jelenti, hogy φε eloször csökken, majd növekszik növekvo Kiszámoltuk a
i
valószínuség p
paraméter. az optimális bünteto
i
593
14.2. Több lehetséges megoldás eloállítása
100
98
96 % 94
92
0.75
0.70
0.65
0.60
0.55
0.50
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
90
ε 14.3. ábra.
φεi
értékei
ε1 = 0.025, ε2 = 0.050, . . . , ε30 = 0.750-re 25 × 25-ös rácson.
∗ További kísérletek azt is kimutatták, hogy az optimális paraméter ε a probléma méretének nö∗ ∗ vekedésével csökken. (Például ε ≈ 0.6 volt 5 × 5-ös rácsokra, ε ≈ 0.175 25 × 25-ös rácsokra, és ε∗ ≈ 0.065 100 × 100-as rács gráfokra.)
A büntetéses megoldások monotonitási tulajdonságai Függetlenül attól, hogy egyszerre az összes
ε-büntetés
melletti megoldást generáljuk-e,
strukturális tulajdonságok bizonyíthatók: vagy csak egyetlen egyet, a következo Az
ε
tényezo fokozatos növekedésével olyan Bε megoldásokat kapunk, amebünteto
lyekre
•
része monoton módon egyre jobban illeszkedik (a megoldás a célfüggvény p bünteto egyre kevesebb büntetett részt tartalmaz),
•
az eredeti w célfüggvény monoton módon egyre rosszabbá válik, ami kompenzálja a részben bekövetkezo javulást. bünteto tétel mondja ki pontosan. A fenti állításokat a következo
14.3. tétel. Legyen w : E
→R
egy valós értéku függvény, p : E
→ R+
pedig egy pozitív
deniálva minden valós értéku függvény az E-n. Legyen Bε a 14.2. deníciónak megfeleloen
ε ∈ R+ -ra. Ekkor a következo négy állítás igaz. 1.
p(Bε ) gyengén monoton csökkeno
2.
w(Bε ) gyengén monoton növekvo
3.
A w(Bε )
4.
w(Bε )
ε-ra nézve.
ε-ra nézve.
− p(Bε ) különbség gyengén monoton növekvo ε-ra nézve.
+ ε · p(Bε ) gyengén monoton növekvo ε-ra nézve.
Bizonyítás. Legyen
δ és ε két tetszoleges nem negatív valós szám, amelyekre 0 ≤ δ < ε.
594
14. Ember-gép kölcsönhatás
egyenlotlenségek Bδ és Bε deníciójából adódóan a következo teljesülnek.
1.
ε < ∞ esetén w(Bε ) + ε · p(Bε ) ≤ w(Bδ ) + ε · p(Bδ ) , w(Bε ) + δ · p(Bε ) ≥ w(Bδ ) + δ · p(Bδ ) .
(14.1) (14.2)
a következot kapjuk: (14.2)-t kivonva (14.1)-bol (ε − δ) · p(Bε ) ≤ (ε − δ) · p(Bδ ) | : (ε − δ) > 0 ⇔ p(Bε ) ≤ p(Bδ ) . ε = ∞ esetén (14.3) ) egyenlotlenség közvetlenül következik a B∞ megszorozva 2. Vonjuk ki (14.3)-at (14.2)-bol w(Bε )
(14.3) deníciójából.
kapjuk: δ-val, ekkor a következot
≥ w(Bδ ) .
(14.4)
ekkor a következot kapjuk: 3. Vonjuk ki (14.3)-at (14.4)-bol, w(Bε )
− p(Bε ) ≥ w(Bδ ) − p(Bδ ) .
az 4. (14.2)-bol w(Bδ )
⇒
ε > δ ≥ 0 egyenlotlenség felhasználásával a + δ · p(Bδ ) ≤ w(Bε ) + δ · p(Bε ) ≤ w(Bε ) + ε · p(Bε ) w(Bε ) + ε · p(Bε ) ≥ w(Bδ ) + δ · p(Bδ )
(14.5)
egyenlotlenséget kapjuk.
Több alternatív megoldás létrehozása ugyanarra az
ε bünteto paraméterre
Ha adva van egy S 0 megoldás és további alternatív megoldásokra van szükségünk, akkor módszert többször egymás után, különbözo alkalmazhatjuk a bünteto
ε1 < · · · < εm
para-
méterekkel büntetve az S 0 -t. Az így kapott megoldások rendre S ε1 , S ε2 , . . . , S εm . Ennek a módszernek az a nagy hátránya, hogy csak az eredeti S 0 megoldásnak és az egyes alternatív megoldásoknak a közös részére van hatása az
εi
alternatív értékeknek, de két különbözo
megoldás közös részére nincsen hatása. Ezért az S εi és S ε j nagyon hasonló is lehet külön i-re és j-re (i bözo
6,
j).
módszert iteratívan alkalmazzuk ugyanarra az Ezt elkerülhetjük, ha a bünteto
ε-ra.
I´- - (w, p, k, ε) ¨ ´ 1
oldjuk meg az eredeti min w(B) problémát és keressük meg az optimális S 0 megoldást
← ε · w(B ∩ S 0 ) bünteto függvényt + ε · p1 (B) problémát és keressük meg az S 1
2
deniáljuk a p1 (B)
3
oldjuk meg a módosított min w(B)
4
for j
5 6
← 2 to k do p j (B) ← ε · w(B ∩ S 0 ) + ε · w(B ∩ S 1 ) + · · · + ε · w(B ∩ S j−1 ) oldjuk meg a módosított min w(B) + ε · p j (B) problémát és keressük meg az S
7
j
megoldást
return (S 0 , S 1 , . . . , S k )
változattal is helyettesíthetjük: Az 5. lépést a következo
megoldást
595
14.2. Több lehetséges megoldás eloállítása
5
∗
do p j (B)
← ε · w(B ∩ (S 0 ∪ S 1 ∪ · · · ∪ S j−1 ))
esetben (5) a j számú S 0 , S 1 , . . . S j−1 megoldás közül r-hez tartozó megoldásAz elso
∗
részt r ·ε tényezovel bünteti. A második esetben (5 ) az S 0 , S 1 , . . . or S j−1 megoldások közül legalább egyhez tartozó megoldásrészt egyszeres multiplicitással bünteti. A teljesítménybeli lehet. A legrövidebb útvonal problémára azonban három különbség a két eset között jelentos (S 0 , S 1 és S 2 ) megoldás esetén az (5) változat valamivel jobb eredményt adott. 14.6. példa. Vegyük ismét a 14.2. ábrán látható G
=
(V, E) gráfot. Az
ε = 0.1
paraméterre bünteto
T -be vezeto legrövidebb út PD , amelynek hossza vonatkozóan keressünk három megoldást. Az S -bol csúcsokat érinti: S - A - C - D - F -T . Ha a PD éleinek hosszát megszorozzuk 1.123, és a következo del, és megoldjuk a kapott legrövidebb út problémát, akkor a P B útvonalat kapjuk, amely a következo csúcsokon megy keresztül: S - A - B - F - T . Ha az (5) lépésben megadott módszert követjük, akkor az (A, C), (C, D), (D, F), (A, B) és (B, F) tényezovel élek hosszait kell 1.1 bünteto megszoroznunk. Az (S , A) és (F, T ) éleket 1.2-vel kell megszoroznunk (dupla büntetés). Az ily módon kapott optimális megoldás PH lesz, ami az S - G - H - T csúcsokon megy keresztül.
14.2.5. Lineáris programozás büntet® módszer Jól ismert tény, hogy a legrövidebb útvonal probléma, hasonlóan sok más áramlási problémához, lineáris programozással is megoldható. A lineáris programozás segítségével al ternatív megoldások is létrehozhatók. Eloször az eredeti legrövidebb útvonal problémára mutatjuk be a lineáris programozást. A legrövidebb útvonal probléma lineáris programként megfogalmazva Vegyünk egy G
=
(V, E) irányított gráfot, és egy w : E
→ R+
függvényt, amelyik a gráf
minden éléhez egy hosszúságot rendel. Legyen s és t a gráf két megkülönböztetett pontja. t-be? Melyik a legrövidebb egyszeru útvonal s-bol Minden e
= (i,
j)
∈
E élre bevezetünk egy xe változót. xe -nek 1 értéket kell kapnia ha
az e él része a legrövidebb útvonalnak, egyébként pedig 0-t. Jelöljük S (i) E}
⊆
csúcsok halmazát, P(i) V -vel az i csúcsra rákövetkezo
= {j ∈
= { j ∈ V : (i, j) ∈ ∈ E} ⊆ V -
V : ( j, i)
o csúcsok halmazát. Az LPlegrövidebb-út lineáris program a vel pedig az i csúcsot megeloz következoképpen X formalizálható: min
w(e)
· xe
e∈ E
X
feltéve, hogy
x(s, j)
−
j∈S (s)
X x( j, s)
=1
feltétel az s kezdopontra kimeno vonatkozóan,
j∈ P(s)
X
x(t, j)
−
j∈S (t)
X
x( j,t)
= −1
feltétel a t végpontra vonatkozóan, bemeno
x( j,i)
=0
minden további i
j∈ P(t)
X
x(i, j) j∈S (i)
−
X
∈ V \{ s, t}pontra
j∈ P(i)
pontokra Kirchhoff-feltételek a belso 0
≤
xe
≤ 1 minden e ∈
E-re
.
596
14. Ember-gép kölcsönhatás
A 1 1
1.1 1 1.2
B
S
C
1 1
T
D módszerhez. 14.4. ábra. Példa gráf az LP-bünteto
és végpontra vonatkozó feltételek miatt s egy forrás, t pedig egy nyelo. A A kezdo Ezért kell, hogy legyen egy Kirchhoff-feltételek miatt nincs több forrás, sem pedig nyelo. t-be vezeto s-bol
kapcsolat. Nem nyilvánvaló, hogy ez a kapcsolat egy egyszeru út. Az xe változóknak lehetne nem
áramegész értéke is, vagy körök is elofordulhatnának bárhol. Van azonban egy alapveto lástani tétel, amelyik azt mondja ki, hogy az LPlegrvidebb−t lineáris programnak van olyan optimális megoldása, amelyre minden xe
> 0 értéke egyenlo 1-el. Az
xe
= 1-nek megfelelo
t-be. élek egy egyszeru útvonalat adnak s-bol 14.7. példa. Vegyük a 14.4 ábrán látható gráfot. A legrövidebb útvonal problémához tartozó lineá ris programozási feladat most hat egyenloség feltételt tartalmaz (minden csomópontra egyet), és hét egyenlotlenség párt (minden élre egy párt).
min(xS A feltéve, hogy xS A
Az optimális megoldásra xS B
+ xS B + xBC + xCT + xDT ) · 1 + xAC · 1.1 + xBD · 1.2 + xS B = 1,
xCT
+ xDT = 1 ,
xS A
− xAC = 0,
xS B
− xBC − xBD = 0 ,
xAC
+ xBC − xCT = 0,
x BD
− xDT = 0 ,
0
≤
xS A , xS B , xAC , x BC , x BD , xCT , xDT
=
x BC
=
xCT
≤1.
= 1.
t-be Egy lineáris programozási feladat, amelyik két alternatív útvonalat ad meg s-bol Az alábbiakban megadjuk annak a feladatnak a lineáris programozásbeli reprezentációját, t-be. amelyik két alternatív útvonalat keres meg s-bol Minden e
=
(i, j)
∈
E élre bevezetünk két változót, xe -t és ye -t. Ha az e él mindkét
útvonalnak része, akkor xe és ye is 1 értéket fog kapni. Ha az e él csak egy útvonalnak része, akkor xe értéke 1 lesz, ye értéke pedig 0. Egyébként mind xe , mind ye 0 értéket kap.
ε>
0
paraméter, amellyel a mindkét útvonalban szereplo éleket büntetjük. egy bünteto A fentiek gyelembe vételével a következoképpen formalizálhatjuk az LP2-rövid-út lineáris programozási feladatot:
597
14.2. Több lehetséges megoldás eloállítása
min f (x, y) :=
X
· xe + (1 + ε) · w(e) · ye
w(e) e∈ E
X feltéve, hogy
x(s, j)
+ y(s, j) −
j∈S (s)
X x( j, s)
+ y( j, s) = 2
feltétel az s kezdopontra vonatkozóan
j∈ P(s)
X
x(t, j)
+ y(t, j) −
j∈S (t)
X
x( j,t)
+ y( j,t) = −2
feltétel a t végpontra vonatkozóan
x( j,i)
+ y( j,i) = 0
Kirchhoff-feltételek
j∈ P(t)
X
x(i, j)
+ y(i, j) −
j∈S (i)
X
j∈ P(i)
minden további pontra i
0
≤
xe , ye
≤ 1 minden e ∈
E-re
∈ V \{ s, t}
.
gráfot. A két alternatív útvonal problémához tar14.8. példa. Tekintsük ismét a 14.4. ábrán szereplo tozó lineáris programozási feladat most hat egyenloség feltételt tartalmaz (minden csúcspontra egyet), és 2
· 7 = 14 egyenlotlenség párt.
min
(xS A
+
(yS A
feltéve, hogy xS A
+ xS B + xBC + xCT + xDT ) · 1 + xAC · 1.1 + xBD · 1.2 + yS B + yBC + yCT + yDT ) · 1 + yAC · 1.1 + yBD · 1.2 · (1 + ε) + yS A + xS B + yS B = 2 ,
xCT
+ yCT + xDT + yDT = 2 ,
xS A
+ yS A − xAC − yAC = 0,
xS B
+ yS B − xBC − yBC − xBD − yBD = 0 ,
xAC
+ yAC + xBC + yBC − xCT − yCT = 0,
x BD
+ yBD − xDT − yDT = 0 ,
0
≤
xS A , xS B , xAC , x BC , x BD , xCT , xDT , yS A , yS B , yAC , y BC , y BD , yCT , yDT
≤1.
A lineáris programozási feladatot úgy értelmezhetjük, mint egy minimális költségu áramlási problémát. De hol van vajon a kapcsolat a lineáris programozási feladat, és a között t-be? a probléma között, hogy keresnünk kell két útvonalat s-bol 14.4. tétel. Ha az LP2-rövid-út lineáris programozási feladatnak van optimális megoldása, akkor van olyan (x, y) optimális megoldása is, amelyik a következo tulajdonságokkal rendelkezik. Léteznek olyan E 1 , E 2 , E 3
⊆
E diszjunkt halmazok, amelyekre
∩ E2 = ∅, E1 ∩ E3 = ∅ és E2 ∩ E3 = ∅, (ii) xe = 1, ye = 0 minden e ∈ E 1 ∪ E 2 , (iii) xe = 1, ye = 1 minden e ∈ E 3 , (iv) xe = 0, ye = 0 minden e < E 1 ∪ E 2 ∪ E 3 . (v) E 1 ∪ E 3 egy P1 s-bol t-be vezeto utat reprezentál, E 2 ∪ E 3 egy P2 (i)
E1
s-bol t-be vezeto utat
ábrázol. E 3 pedig azon élek halmaza, amelyek mindkét útvonalban szerepelnek.
598
14. Ember-gép kölcsönhatás
S
a
c
e
g
b
d
f
h
T
14.5. ábra. Példa két útvonal nem egyértelmu dekompozíciójára.
(vi) Nem létezik olyan (Q1 , Q2 ) ) útvonal pár, amelyik jobb lenne (P1 , P2 )-nél, azaz
w(P1 )
+ w(P2 ) + ε · w(P1 ∩ P2 ) ≤w(Q1 ) + w(Q2 ) + ε · w(Q1 ∩ Q2 ), minden (Q1 , Q2 ) párra.
Ez éppen azt jelenti, hogy a P1 és P2 -beli élhosszak összege plusz a kétszer használt élekre vonatkozó büntetés minimális.
A fentiekhez még az alábbi megjegyzéseket fuzhetjük.
•
Minden élhez két változó tartozik, xe és ye . Ezt értelmezhetjük úgy is, mint egy olyan utcát, amelyiken van egy normális sáv, és egy további extra sáv. Az extra sáv használata drágább, mint a normális sávé. Ha egy megoldás egy élt csak egyszer használ, akkor az olcsóbb, normális sávot használja. Ha azonban a megoldás kétszer használja az élt, akkor a normális sávot és az extra sávot is használja.
•
csúcspontból a végso csúcspontba vezeto útvonalának a Az (x, y) megoldásnak a kezdo T -be két útvonal párt felbontása a legtöbb esetben nem egyértelmu. A 14.5. ábrán S -bol is eloállíthatunk, (a − c − e − g, b − d − f
− h)-t és (a − c − f − h,
b − d − e − g)-t. Mindkét
pár egyformán optimális a 14.4. tétel értelmében. Így a felhasználónak kell választania közülük más, további szempontok alapján.
•
módszer és az LP-bünteto módszer általában különbözo megoldásokhoz veA bünteto módszer kiszámolja az egyetlen legjobb megoldást, és egy megfelelo zet. A bünteto módszer két jónak mondható megoldást számol ki, amealternatívát. Az LP-bünteto lyek között kicsi az átfedés. A 14.4. ábrán láthatjuk, hogy ez a pár nem feltétlenül T -be vezeto legrövidebb útvonal tartalmazza a legjobb megoldást. Az ábrán az S -bol
ε > 0.1-re az ε büntetés melletti megol= S ACT . A (P1 , P2 ) útvonal pár összhossza 6.1, a közös szakaszok hossza módszer a (P2 , P3 ) = (S ACT , S BDT ) 1.0. ε > 0.2-re azonban az LP-bünteto amelyek össz hossza 6.3, a közös szakaszaik hossza pedig 0. útvonalakat állítja elo, P1
=
S BCT , amelynek hossza 3. Minden
dás P2
•
Lehetséges lenne k darab megoldásjelölt útvonal megkeresése is valamely k k −1
bevezetünk k darab xe , xe , . . . , xe 0
1
>
2-re, ha
változót minden e élre, és beállítjuk s kínálatát és t
599
14.2. Több lehetséges megoldás eloállítása
keresletét k-ra. Célfüggvényként használhatjuk például a következot:
min f (x
0
, . . . , xk−1 ) :=
k−1 XX
e∈ E
(1
+ j · ε) · w(e) · xej
(1
+ ε) j · w(e) · xej .
j= 0
vagy min f (x
0
, . . . , xk−1 ) :=
k−1 XX
e∈ E
•
j= 0
módszer nem csak a legrövidebb útvonal problémára muködik. Az LP bünteto Általánosíthatjuk azt bármilyen, lineáris programozással megoldható problémára.
•
Egy hasonló módszert, az egész értéku lineáris programozásos bünteto módszert alkalmazhatunk egész értéku lineáris programozási feladatokra.
14.2.6. Büntet® módszer heurisztikák alkalmazásával módszernek egzakt algoritmusokkal együtt való alkalmazáA 14.2.2. pontban a bünteto sát tárgyaltuk. Ilyen volt például a Dijkstra-algoritmus, vagy a dinamikus programozás a módszert azonban (egzakt megoldások helyett) legrövidebb útvonal problémára. A bünteto heurisztikák esetén is alkalmazhatjuk több megoldás jelölt megkeresésére. cserével 14.9. példa. Egy jól ismert heurisztika az utazóügynök problémára a lokális keresés kettos (lásd a 14.2.1. pontot). B ´ --´ - - ¨ ¨ ¨ - ´ ´ - ´ 1
csere heurisztikát a büntetés nélküli problémára, alkalmazzuk a kettos
2
büntessük meg a T -hez tartozó éleket úgy, hogy megszorozzuk a hosszukat (1
3
csere heurisztikát a büntetés melletti problémára, alkalmazzuk a kettos
4
számoljuk ki a T ε módosítás nélküli hosszát
5
return (T , T ε )
az így kapott lokálisan optimális megoldás (ami nem feltétlenül globálisan optimális) legyen T
+ ε)-nal
az így kapott alternatív megoldás legyen T ε
Kérdés: Milyen
ε≥
0 paramétert használjunk, hogy a leggyorsabb útvonal utazási idejét mini-
malizálni tudjuk? A 14.5. példában már ismertetetthez hasonló kísérletet végeztek el az utazóügynök problémára 25 véletlenül kiválasztott ponttal az egységnégyzetben. A 14.6. ábra az arányosított átlagokat mutatja
ε0 = 0.000, ε1 = 0.025, . . . , ε30 = 0.750 értékekre. A megoldás párok φε várható minosége (most is) unimodális az ε büntetési tényezore nézve. Ez ∗ ε-ra. Ebben a példában ε ≈ 0.175 az azt jelenti, hogy φε eloször csökken, majd növekszik növekvo
az
paraméter. optimális bünteto További kísérletek azt is kimutatták, hogy az
ε∗ optimális paraméter a probléma méretének növe-
kedésével csökken.
Gyakorlatok utazóügynök problémára vonatkozó programozási gyakorlat segít ab14.2-1. A következo, ban, hogy jobban átérezzük a lokális optimumok nagy változatosságát. Generáljunk vélet-
600
14. Ember-gép kölcsönhatás
102
101
% 100
99
0.75
0.70
0.65
0.60
0.55
0.50
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.10
0.05
98
ε 14.6. ábra.
φεi
az
ε0 = 0, ε1 = 0.025, . . . , ε30 = 0.750 értékekre 25 × 25-ös rácson.
lenszeruen 200 pontot a 2-dimenziós egységnégyzetben. Számoljuk ki a távolságokat az cserével, véletEuklideszi metrika szerint. Futtassuk le százszor a lokális keresést kettos útvonalból kiindulva. Számoljuk meg, hogy hány különbözo lokális lenül választott kezdo minimumot találtunk. internetes keresomotoroknak. 14.2-2. Adjuk meg ugyanazokat a kulcsszavakat különbözo Hasonlítsuk össze a találati listákat, és azok változatosságát. 14.2-3. Formalizáljuk az utazóügynök problémát egy
P
-típusú problémaként.
14.2-4. Bizonyítsuk be a 589. oldalon található megjegyzésben foglalt állítást. függvény additív büntetés esetén, mint például a 14.2. 14.2-5. Hogyan néz ki a p(e) bünteto példában? (1) és (2) tulajdonságokat. 14.2-6. Bizonyítsuk be a 591. oldalon levo 14.2-7. Alkalmazzuk az
´ algoritmust a 14.2 ábrán látható legrövidebb
útvonal problémára S kezdoponttal és T végponttal. Legyen w(e) az él hossza minden e-re, p(e) pedig legyen azokra az élekre, amelyek hozzátartoznak PD -hez (S - A - C - D - F - T útvonal) az él hossza, a többi élre pedig p(e)
= 0. Vagyis egy útvonalra vonatkozó büntetés
lesz azon szakaszainak hosszával, amelyek közösek PD -vel. értéke egyenlo
ε > 0 bünteto paramétert a 595. oldalon levo 14.6. példában, hogy = 3-ra az ott leírt elso módszer (a pszeudokód 5. sora) három különbözo útvonalat hozzon
14.2-8. Keressünk olyan k
∗
létre, a második módszer (a pszeudokód 5 sora) viszont csak kettot.
14.3. További interaktív problémamegoldó algoritmusok Van néhány további terület, ahol egy embernek kell a számítógép által generált megoldásjelöltek közül választania. Ebben a szakaszban négy fontos esetet mutatunk be ezek közül, vegyes témákkal zárjuk e fejezetet. majd különbözo
601
14.3. További interaktív problémamegoldó algoritmusok
14.3.1. Tetsz®leges futási idej¶ algoritmusok Egy ilyen tetszoleges futási ideju algoritmusban a számítógép elkezd dolgozni egy prob pillanattól kezdve folyamatosan jelennek meg a megoldásjelöltek lémán, és szinte az elso (mindig az addig talált legjobbak) a képernyon. Természetesen egy ilyen folyamat során a megoldások, amelyeknek az optimakezdeti outputok gyakran csak elozetes, vagy közelíto litása nem garantált, és ezek még messze vannak a tökéletes megoldástól. Nézzünk egy példát. Az iteratív mélyítés többszörös, mélységében korlátozott keresést végez, és minden lépésben fokozatosan növeli a keresés mélységi korlátját. Tegyük fel, hogy a feladatunk jó megoldások keresése egy nagyméretu T
R
=
(V, E) fában. Legyen f : V
→
a maximalizálandó függvény, Vd pedig a fa azon csúcspontjainak halmaza, amelyek d
távolságra vannak a gyökértol. F´ -´ -´ -´-´ ´´ (T , f )
← ←1
1
Opt
2
d
3
while d
4
f (root)
Opt ← Maxd
then Opt
7
d
←d+1
Minden idopillanatban az éppen aktuális legjobb megoldás (Opt) jelenik meg a monitoron. Az operátor bármelyik pillanatban megállíthatja a folyamatot. Az iteratív mélyítés nem csak a számítógép és ember kölcsönhatásával foglalkozó terület számára érdekes, hanem van számos alkalmazása a teljesen automatizált számításokban játékok fájában való keresés. A versenysakkban a programnak is. Jó példa erre a különbözo áll rendelkezésére 40 lépés megtételére. Itt az iteratív mélyítés kulcsfontosságú rögzített ido eszköz abban, hogy megtaláljuk az egyensúlyt az idofelhasználás és az alfa-béta keresés között. Egy másik gyakori példa tetszoleges futási ideju algoritmusokra egy heurisztika ismételt alkalmazása. Legyen f
: A
→ R
valamilyen bonyolult függvény, és keressük a
elemeket. Legyen H egy valószínuség nagy függvényértékkel rendelkezo alapú heurisztika, amely egy megoldásjelöltet ad meg erre az (A, f ) maximalizálási problémára. H lehet például valamilyen lokális keresés, vagy más gradiens módszeren alapuló eljárás. H-t alkalmazhatjuk újra és újra, egymástól független menetekben, és mindig az eddig talált legjobb megoldást kínáljuk fel kimenetként. A tetszoleges futási ideju algoritmusok harmadik alkalmazási területe a Monte Carlo szimulációk, például a Monte Carlo integráció. Egy statikus megközelítés elore meghatározott számú (pl. 1000) véletlen pont alapján muködne, és ezek alapján adná meg az átlagot az outputban. Azonban már a menet közbeni átlag értékek (1, 2, 3 pont után, vagy minden 10-es, 50-es blokk után) adhatnának elorejelzést arra vonatkozóan, hogy melyik régióban eredmény, illetve, hogy van-e értelme az összes lépés végrehajtásának. A várható a végso varianciáknak és a kilógó értékek gyakoriságának a megjelenítése további információt szolgáltat arra vonatkozóan, hogy mikor a leginkább érdemes megállítani a Monte Carlo eljárás futását.
602
14. Ember-gép kölcsönhatás
rendszerekben a tetszoleges Az ember és számítógép együttmuködését feltételezo fu tási ideju algoritmusok még egy további elonnyel rendelkeznek, mégpedig azzal, hogy a számítások ideje alatt az ember már értékelheti és összehasonlíthatja az elozetes megoldásjelölteket.
14.3.2. Interaktív evolúció és generatív tervezés algoritmusok, amelyek a természetes kiválasztóA genetikus algoritmusok olyan kereso dáson és a természetes genetikán alapulnak. Egyetlen megoldás helyett megoldások egész populációjával foglalkoznak. A genetikus algoritmusokat gyakran alkalmazzák olyan nagy és bonyolult problémákra, amelyeknél a hagyományos optimalizálás csodöt mond. Az interaktív evolúció olyan evolúciós algoritmus, amely emberi közremuködést igényel. Az interaktív evolúció során a felhasználó választ ki egy vagy több egyedet az aktuális populációból, amelyek túlélve és önmagukat (mutációval) reprodukálva az új generációt fogják alkotni. Így az interaktív evolúcióban a felhasználó játssza a célfüggvény szerepét, folyamatban. és ezért meglehetosen aktív szerepe van a kereso Az olyan területeken mint a muvészet, építészet, fényképfeldolgozás (beleértve a fantomképek tervezését), az interaktív evolúciónak egy speciális formáját, az úgynevezett generatív tervezést használják. A generatív tervezés során az aktuális generáció összes meg oldását egyidejuleg láthatjuk a képernyon. Itt az összes alatt általában egy 4 és 20 közötti számra kell gondolni. Gondoljunk a fényképfeldolgozás példára, ahol a felhasználó kivá laszthatja a módosított kontrasztot, fényerot, szín intenzitást és élességet. A felhasználó megvizsgálja az aktuális jelölteket, és egyetlen egérkattintással bejelöli azt, amelyik a legjobban tetszik neki. Az összes többi megoldás törölve lesz, és a megjelöltnek N darab újabb mutánsa generálódik. A folyamat addig folytatható amíg a felhasználó meg lesz elégedve az eredménnyel. A generatív tervezésben járatlan ember számára talán hihetetlenül hang zik, de gyakran még egy gyenge minoség u kiinduló megoldásból is néhány iteráció alatt elfogadható eredmények születnek.
14.3.3. Egymást követ® rögzítések Számos probléma sokdimenziós, és így sok paraméter beállítását igényli. Ha egy ilyen prob heurisztikák ismételt alkalmazáléma esetén jó megoldásoknak egy halmazát állítjuk elo többlépéses, interaktív folyamatot használhatjuk. Eloször sával, akkor a következo néhány ember megvizsgál. A szakérto elso heurisztikus megoldást generálunk, amiket egy szakérto sorban
tipikus mintákat keres a megoldásokban és rögzíti ezeket. Ezután további heurisz tikus megoldásokat generálunk azzal a mellékfeltétellel, hogy valamennyien tartalmazzák a ismét megvizsgálja a megoldásokat, és újabb részekorábban rögzített részeket. A szakérto
ket rögzít. A folyamat addig folytatódik, amíg minden rész rögzített lesz, és így egyetlen (és remélhetoleg jó) megoldást kapunk.
14.3.4. Interaktív több feltételes döntéshozatal vagy több célfüggvényünk A több feltételes döntéshozatal esetén nem egy, hanem ketto van. A feladat olyan elfogadható megoldások keresése, amelyek az összes célfüggvényt legjobbak. Általában a célfüggvények többé-kevésbé ellentmondagyelembe véve a leheto nak egymásnak, és így kizárják az egyértelmu optimum létezését. Hasznos lehet ilyenkor a
14.3. További interaktív problémamegoldó algoritmusok
603
hatékony megoldás fogalma, amit a következoképpen deniálhatunk: egy hatékony meg oldás esetén nem létezik olyan másik megoldás, amelyik legalább egy célfüggvény szempontjából jobb nála, az összes többi szempontjából pedig nem rosszabb. lépés lenni, hogy kiszámoljuk a A több feltételes döntéshozatalnál az szokott az elso hatékony megoldásokat. A két feltételes esetben a
hatékony határt vizuálisan is megje leníthetjük egy kétdimenziós diagramon, ami az emberi döntéshozónak jó áttekintést ad a lehetoségekr ol.
14.3.5. Különböz® további témák •
hogy a száSzámítógépes megoldások grakus megjelenítése. Az még nem elegendo, megoldásjelölteket generál, az eredményeket megfelelo módon meg mítógép megfelelo is kell jeleníteni. Egyetlen megoldás esetén a fontos részeket és tulajdonságokat kell megoldás esetén a különbségeket és a speciakiemelni, míg több, egymással versengo litásokat kell hangsúlyozni.
•
Folyamatos számítógépes futás rövid emberi közbeavatkozásokkal. Ezt a módszert szo hasonlat miatt. Az ember minden nap 1 + 23 óra mód-nak is nevezni a következo alatt megnézi az elmúlt 23 órában a számí1 órát ül a számítógép elott. Ez alatt az ido kás
interakciókat végez a géppel, valamint tógép által eloállított eredményeket, különbözo 23 órában. Így az ember az idejének megmondja neki, hogy mit csináljon a következo csak egy kis részét fekteti be a munkába, a gép viszont folyamatosan fut. Egy jó példa a fentiekre a levelezési sakk, ahol a számítógép segítségének igénybevétele játékosok legtöbbje egy vagy több számítógépet hivatalosan is megengedett. A vezeto futtat egész nap, amelyek a kritikus állásokat és folytatásokat elemzik. A sakkozók töltenek az csupán összegyujtik ezeket az eredményeket, és naponta csak egy rövid idot elemzésükkel.
•
Váratlan hibák és numerikus instabilitások.
Minden programban van hiba! ezt az alapszabályt gyakran elfelejtik. Az emberek túlságosan gyakran minden kritika nélkül elhiszik, amit a monitoron látnak, vagy amit a szoftvertermék leírásában olvas nak. Mégis meglepoen gyakran elofordul, hogy ugyanarra a feladatra (aminek egyetlen eredményeket optimális megoldása van) több független programot futtatva különbözo progkapunk. A numerikus stabilitás sincs ingyen. Ugyanarra a problémára különbözo eredményt adhatnak a kerekítési hibák miatt. Ezeket a hibalehetosé ramok különbözo geket úgy fedezhetjük fel, ha egymástól független programokat futtatunk. Természetesen a hardverben is lehetnek hibák, foleg a folyamatos miniatürizálás korában. Ezért kritikus helyzetekben az lehet a jó stratégia, ha ugyanazt a programot teljesen független gépeken futtatjuk le, lehetoleg egymástól független operátor személyzet segítségével.
Gyakorlatok
14.3-1. Tekintsük az utazóügynök problémát 200 véletlenszeru (xi , yi ) ponttal a [0, 1]×[0, 1] egységnégyzetben, az Euklideszi távolsággal. Generáljunk 100 lokálisan optimális megol cserével, lásd a 14.2.1. pontban) és számoljuk össze, hogy melyik él hányszor dást (a kettos ebben a száz megoldásban. Deniáljunk egy K küszöböt (például K fordul elo
= 30) és rög-
604
14. Ember-gép kölcsönhatás
zítsük azokat az éleket, amelyek legalább K megoldásban elofordulnak. Generáljunk újabb 100 megoldást, úgy, hogy a rögzített élek cseréjét ne engedjük meg. Ezt ismételjük addig, sorozatok amíg a folyamat nem konvergál, majd hasonlítsuk össze a végeredményt az elso lokális optimumaival. jellemzo
Megjegyzések a fejezethez Az
ember-gép kapcsolat bevezetésben idézett deníciójának forrása a HCI Bibliog raphy [366]. Sameith [409] technikai jelentésében számos kísérletet, leírást és elemzést találunk a módszerre, különbözo összeg típusú problémák, dimenziók és hibaszélességek esebünteto tére. A 14.3. tétel bizonyítása eloször [14]-ben jelent meg. Az e-kereskedelemben a több választási lehetoséget kínáló rendszereket gyakran
Tanácsadó rendszerek-nek nevezik tartva a vevoket, mint például Resnick és Varian cikkében [384] szem elott akik számára termékeket ki kell listázni. Értheto okokból a kereskedelmi kereso motorok az oket érdeklo és az e-cégek titokban tartják a kivonatoló algoritmusaikat. A 14.2.5. pontban említett áramlástani tétel megtalálható Ahuja, Magnanti és Orlin könyvében [7]. programot forgalmaz az AND cég [514]. Muholdas Egy útvonaltervezo felvételeken alapuló útvonaltervezéssel foglalkozik Berger [44] diplomamunkája. A BigBlackCell nevu szoftver Grosse és Schwarz munkája [178]. jó tankönyvnek. Az A genetikus algoritmusokról például Goldberg [156] tekintheto interaktív evolúciót és a generatív tervezést Banzhaf [30] tárgyalja. A több feltételes döntéshozatallal több cikk is részletesen foglalkozik, az egyik alapmu Gal, Stewart és Hanne könyve [145]. és a versenysakkban elért sikereiAlthöfer könyvében [11] a 3-agy történeti hátterérol olvashatunk. A 3-agy és Juszupov nagymester közötti mérkozésr [12] számol be. [13] rol ol amikor több számítógép javaslatát használva javítáltalános tájékoztatást ad arról az esetrol, [15] néhány k-legjobb megvalósítást mutat be játékok fájában való keresésre juk a játékerot. web címen tekintiteratív mélyítéssel. Ezen megvalósítások képernyomentéseit a következo hetjük meg: http://www.minet.uni-jena.de/www/fakultaet/iam/personen/k-best.html. [200] a sakkprogramok és más bonyolultabb játékok technikai hátterét mutatja be. M. Zuker és D. H. Turner által írt programok értékes on-line gyujteménye található a http://www.bioinfo.rpi.edu/applications/mfold címen. A felhasználó bevihet például RNS láncokat, és a rendszer valós idoben eloállítja ezen láncok lehetséges másodlagos térszerkezetét. Többek között olyan paraméterek adhatók meg, mint a száma (alapértelmezés téke (alapértelmezés
=
50), vagy például az optimálistól való
= 5 %).
kiszámított gyur odések százalékos eltérés mér
A genetikai algoritmusokkal magyarul foglalkozik Álmos Attila, Gyori Sándor, Horváth Gábor és Várkonyiné Kóczy Annamária könyve [293], a kapcsolódó biológiai fogalmak megismeréséhez pedig Podani János könyvét [374] ajánljuk.
15. Számítógépes grafika
A számítógépes graka egy virtuális világot épít fel a memória adatszerkezeteiben, amit egy virtuális kamerával fényképez le. A virtuális világ alakzatokat (pontokat, szakaszokat, felületeket, testeket stb.) tartalmaz, amit az algoritmikus feldolgozáshoz számokkal írunk le. A képszintézis a virtuális világ és a kamera tulajdonságai alapján számítja ki a képet. A kép feltételezésünk szerint azonos méretu kicsiny téglalapokból, úgynevezett képelemekbol, így elegendo a képszintézist pixepixelekbol áll. Egy képelemhez egyetlen szín rendelheto, lenként egyetlen pontban, például a középpontban végrehajtani. A fényképezés megkeresi a ponton keresztül látható alakzatot, és annak színét írja a kép pixelébe. Ebben a könyvben csak a látható alakzatok meghatározásával foglalkozunk, az alakzatok színét ismertnek tételezzük fel. fejezetekben eloször A következo áttekintjük, hogyan írhatjuk le az alakzatokat számokkal, majd megismerkedünk a fényképezési folyamat algoritmusaival.
15.1. Analitikus geometriai alapok Vizsgálatunk alaphalmaza általában az euklideszi tér. A számítógépes algoritmusokban a tér elemeit számokkal kell leírni. A geometria számokkal dolgozó ága az analitikus geometria, eszköze a vektor és a koordinátarendszer. melynek alapveto 15.1. deníció. A vektor egy irányított szakasz, vagy másképpen egy eltolás, aminek iránya és hossza van, és amely a tér egy pontjához azt a másik pontot rendeli hozzá, amelyik tole a megadott irányban és a vektor hosszának megfelelo távolságban van. A vektorokra a ~ v jelölést fogjuk alkalmazni. A vektor hosszát gyakran a vektor abszolút értékének is mondjuk és |~ v|-vel jelöljük. A vektorokon értelmezzük az összeadás muveletet, amelynek eredménye egy újabb vektor, amely az összeadandó eltolások egymás utáni végrehajtását jelenti. A továbbiakban az összeadásra a~ v1
+ ~v2 = ~v jelölést alkalmazzuk. Beszélhetünk egy vektor és egy szám szorzatáról, amely = ~v), és ugyanabba az irányba tol el, mint a ~v1 szorzandó, de a megadott λ szám arányában kisebb vagy nagyobb távolságra.
ugyancsak vektor lesz (λ · ~ v1
a két vektor hosszának és a bezárt Két vektor skaláris szorzata egy szám, amely egyenlo szögük koszinuszának a szorzatával:
~v1 · ~v2 = |~v1 | · |~v2 | · cos α,
ahol
α a ~v1
és ~ v2 vektorok által bezárt szög
.
606
15. Számítógépes graka
Két vektor meroleges, ha skaláris szorzatuk zérus. Másrészt, két vektor vektoriális szorzata egy vektor, amely meroleges a két vektor síkjára, a hossza pedig a két vektor hosszának és az általuk bezárt szög szinuszának a szorzata:
~v1 × ~v2 = ~v,
~v1 , ~v2 -re, és |~v| ahol ~ v meroleges
= |~v1 | · |~v2 | · sin α .
A két lehetséges meroleges közül azt az irányt tekintjük a vektoriális szorzat irányának, ujja mutatna, ha a hüvelykujjunkat az elso vektor irányába, a amerre a jobb kezünk középso mutatóujjunkat pedig a második vektor irányába fordítanánk (jobbkéz szabály). Két vektor párhuzamos, ha vektoriális szorzatuk nulla.
15.1.1. A Descartes-koordinátarendszer két, nem párhuzamos ~i, ~j vektor lineáris A sík bármely ~ v vektora egyértelmuen kifejezheto kombinációjaként, azaz
~v = x · ~i + y · ~j
alakban. Hasonlóan a tér bármely ~ v vektora egyértelmuen megadható három, nem egy síkba vektor lineáris kombinációjaként: eso
~v = x · ~i + y · ~j + z · ~k . Az ~i, ~j, ~ k vektorokat bázisvektornak, az x, y, z skalárokat koordinátáknak nevezzük. A továbbiakban feltételezzük, hogy a bázisvektorok egységnyi hosszúak, és egymásra páron ként merolegesek. A bázisvektorok ismeretében bármely vektor egyértelmuen megadható számokkal, mégpedig a koordinátáival. Egy pontot egy vektorral adunk meg úgy, hogy megmondjuk, hogy az a tér egy kitüntetett pontjához, az origóhoz képest milyen irányban és távolságra van. Ezt a vektort a pont helyvektorának nevezzük. Az origó és a bázisvektorok együttese a Descartes-koordinátarendszer, amellyel az euklideszi sík, illetve a tér pontjai egyértelmuen számszerusíthet ok. A Descartes-koordinátarendszer az euklideszi geometria algebrai megalapozása, amin azt értjük, hogy a Descartes-koordináta hármasok a tér pontjainak megfeleltethetok, és a geometriai, illetve algebrai fogalmak párba állítása után az euklideszi geometria axiómái (és így a tételei is) algebrai eszközökkel igazolhatók.
Gyakorlatok 15.1-1. Igazoljuk, hogy a Descartes-koordináták és a pontok egy-egyértelmu kapcsolatban állnak. 15.1-2. Bizonyítsuk be, hogy ha a bázisvektorok egységnyi hosszúak és egymásra páron ként merolegesek, akkor (x1 , y1 , z1 )
· (x2 , y2 , z2 ) =
x1 x2
+ y1 y2 + z1 z2 .
15.1-3. Igazoljuk, hogy a skaláris szorzás az összeadásra nézve disztributív.
15.2. Ponthalmazok leírása egyenletekkel megadására. Egy koorA koordinátarendszerek lehetoséget adtak pontok számokkal történo dinátákra megfogalmazott feltételrendszerrel pedig egy teljes ponthalmazt azonosíthatunk.
607
15.2. Ponthalmazok leírása egyenletekkel
f (x, y, z) implicit függvény
test R sugarú gömb
R
2a, 2b, 2c élu téglatest
2
− x2 − y2 − z2
min{a
z tengelyu, r (hurka) és R (lyuk) sugarú tórusz
− | x|, b − |y|, c − |z|} p 2 2 2 r − z − (R − x2 + y2 )
15.1. ábra. Néhány origó középpontú testet deniáló implicit függvény.
koordinátaA feltételrendszer általában egyenlet vagy egyenlotlenség, amelyet kielégíto hármasokhoz tartozó pontokat mondjuk a ponthalmazhoz tartozónak.
15.2.1. Testek A test a háromdimenziós tér egy részhalmaza. A részhalmaz kijelöléséhez egy folytonos f függvényt hívunk segítségül, amely a tér pontjait a valós számokra képezi le, és azokat a pontokat tekintjük a testhez tartozónak, amelyek kielégítik az alábbi implicit egyenlotlenséget: f (x, y, z) Az f (x, y, z)
>
≥0.
pontok a test belso 0 egyenlotlenséget teljesíto pontjai, az f (x, y, z)
<
0
a külso egyenlotlenséget kielégítok pontok. Az f függvény folytonossága miatt a külso pontokat, amelyek között találjuk az f (x, y, z) = 0 egyenletet kielégíto és belso pontokra az f függvény a a test határfelületét alkotják. Szemléletesen a külso
pontok és belso
mért elojeles határfelülettol távolságot jellemzi. Megjegyezzük, hogy szigorú értelemben nem tekintjük a tér pontjainak bármilyen részhalmazát testnek, csak azokat, amelyek nem tartalmaznak háromnál alacsonyabb dimenziós kilógó görbéket, és felületeket), azaz megköveteljük, hogy elfajulásokat (például a testbol pont is legyen. a határfelület minden pontjának tetszolegesen kicsiny környezetében belso algoritmus gyelmen kívül Nem kell azonban betartanunk ezt a feltételt, ha a megjeleníto hagyja az elfajuló részeket. A 15.1. ábra bemutatja a gömböt, téglatestet és tóruszt deniáló implicit függvényt.
15.2.2. Felületek Az f (x, y, z)
=
pontok a test határpontjai, amelyek egy felületet al0 egyenletet kielégíto
kotnak. A felületeket tehát leírhatjuk ezzel az implicit egyenlettel. Mivel a pontokat azok helyvektoraival is deniálhatjuk, az implicit egyenletet megfogalmazhatjuk magukra a helyvektorokra is: f (~ r)
=0.
Egy felületet sokféleképpen adhatunk meg egyenlettel, például az f (x, y, z)
= 0 helyett az = 0 és a 2 · f 3 (x, y, z) = 0 nyilván ugyanazon pontokat jelöli ki. ~n normálvektorú és ~r0 helyvektorú sík azon ~r pontokat tartalmazza, amelyekre
f (x, y, z) 2
Egy az ~ r
− ~r0
vektor a sík normálvektorára meroleges, tehát skalárszorzatuk zérus, így a sík
pontjainak implicit vektor és skalár egyenlete: (~ r
− ~r0 ) · ~n = 0,
nx
· x + ny · y + nz · z + d = 0 ,
(15.1)
608
15. Számítógépes graka
x(u, v) · cos 2πu · sin πv R · cos 2πu R · (1 − v) · cos 2πu
test R sugarú gömb
y(u, v) · sin 2πu · sin πv R · sin 2πu R · (1 − v) · sin 2πu
R
R sugarú, z tengelyu, h magasságú henger R sugarú, z tengelyu, h magasságú kúp
15.2. ábra. Néhány felületet deniáló paraméteres forma, ahol u, v
ahol n x , ny , nz a normálvektor koordinátái és d
z(u, v)
R
R
· cos πv h·v h·v
∈ [0, 1].
= −~r0 ·~n. Amennyiben a normálvektor hossza
egységnyi, a d a síknak az origótól vett elojeles távolsága. Két síkot párhuzamosnak nevezünk, ha normálvektoraik párhuzamosak. Az implicit egyenlet helyett a másik lehetoség a paraméteres forma alkalmazása, amikor a felületnél két szabad paraméter alapján állítjuk be a koordinátákat. Például egy felület paraméteres egyenlete az u, v szabad paraméterekkel: x
=
x(u, v),
y
= y(u, v),
z
= z(u, v),
u
∈ [umin , umax ],
v
∈ [vmin , vmax ] .
az implicit egyenletet úgy származtathatjuk, hogy a A felület paraméteres egyenleteibol kiküszöböljük az u, v szabad paramétereket. három egyenletbol A 15.2. ábra bemutatja a gömböt, hengert és kúpot deniáló paraméteres formát. Az implicit egyenlethez hasonlóan, a paraméteres egyenleteket megfogalmazhatjuk magukra a helyvektorokra is:
~r = ~r(u, v) . A háromszög a ~ p1 , ~ p2 és ~ p3 pontok konvex-kombinációinak halmaza, azaz
~r(α, β, γ) = α · ~p1 + β · ~p2 + γ · ~p3 ,
ahol
α, β, γ ≥ 0
A szokásos, kétparaméteres egyenlethez úgy jutunk, hogy az pedig (1
és
α+β+γ =1 .
α-t
u-val, a
β-t
v-vel, a
γ-t
− u − v)-vel helyettesítjük: ~r(u, v) = u · ~p1 + v · ~p2 + (1 − u − v) · ~p3 ,
ahol u, v
≥0
és u
+v≤1 .
15.2.3. Görbék felület Két felület metszeteként görbét kapunk, amelyet megadhatunk a két metszo f1 (x, y, z)
=
f2 (x, y, z)
=0
alakú implicit egyenleteivel is, de ez általában feleslegesen körülményes. Tekintsük inkább a két felület ~ r1 (u1 , v1 ), illetve ~ r2 (u2 , v2 ) paraméteres formáit. A metszet pontjai kielégítik az ~ r1 (u1 , v1 )
= ~r2 (u2 , v2 )
vektoregyenletet, amely a háromdimenziós térben három skalár-
tehát hármat kiküegyenletnek felel meg. A négy ismeretlen (u1 , v1 , u2 , v2 ) paraméterbol szöbölhetünk, így a görbét az egyváltozós x
=
x(t),
y
= y(t),
z
= z(t),
t
függvényekkel, vagy az
~r = ~r(t), vektoriális alakkal írhatjuk le.
t
∈ [tmin , tmax ]
∈ [tmin , tmax ]
609
15.2. Ponthalmazok leírása egyenletekkel
test ellipszis 2a, 2b fotengely u, z síkon lévo R sugarú, z irányban h emelkedésu csavarvonal (x1 , y1 , z1 ) és (x2 , y2 , z2 ) közötti szakasz
x(u, v) · cos 2πt R · cos 2πt x1 (1 − t) + x2 t a
y(u, v)
z(u, v)
· sin 2πt R · sin 2πt y1 (1 − t) + y2 t b
15.3. ábra. Néhány görbét deniáló paraméteres forma, ahol t
0
·t − t) + z2 t h
z1 (1
∈ [0, 1].
A 15.3. ábra bemutatja az ellipszist, csavarvonalat és szakaszt deniáló paraméteres formát. Figyeljük meg, hogy a felületeken úgy is felvehetünk görbéket, hogy az u, v szabad paraméterek közül az egyiket rögzítjük. Például a v paraméter rögzítésével kapott görbe paraméteres alakja ~ rv (u)
= ~r(u, v). Ezeket a görbéket izoparametrikus görbéknek nevezzük.
Az egyenes pontjai közül jelöljünk ki egyet, és a kijelölt pont helyvektorát nevezzük az egyenes helyvektorának. Az egyenes egy tetszoleges pontját a kijelölt pont egy kitüntetett iránnyal párhuzamos eltolásával kaphatjuk meg. A helyvektort ~ r0 vektorral, a kitüntetett irányt pedig ~ v irányvektorral jelölve, az egyenes egyenlete:
~r(t) = r0 + ~v · t,
t
∈ (−∞, ∞) .
(15.2)
Két egyenest párhuzamosnak mondunk, ha irányvektoraik párhuzamosak. A teljes egyenes helyett egy szakasz pontjait is megadhatjuk, ha a t paramétert egy véges intervallumra korlátozzuk. Például az ~ r1 ,~ r2 pontok közötti szakasz egyenlete:
~r(t) = ~r1 + (~r2 − ~r1 ) · t = ~r1 · (1 − t) + ~r2 · t,
t
∈ [0, 1] .
(15.3)
Ezen deníció szerint a szakasz pontjai a végpontjainak konvex-kombinációi.
15.2.4. Normálvektorok A számítógépes grakában a felülethez tartozó pontok mellett gyakran szükség van az egyes sík normálvektorára). Vepontokban a felület normálvektorára is (azaz a felületet érinto gyünk egy példát. A tükör a fényt úgy veri vissza, hogy a megvilágítási irány, a felületi normális és a visszaverodési irány egy síkban van, és a beesési szög megegyezik a visszave kell rodési szöggel. Ezen (és hasonló) számítások elvégzéséhez tehát a normálvektort is elo állítani. Az implicit egyenlet alapján az érintosík egyenletét a felület (x0 , y0 , z0 ) pont körüli el sofokú Taylor-soros közelítésével kaphatjuk: f (x, y, z)
=
+ (x − x0 ), y0 + (y − y0 ), z0 + (z − z0 )) ≈
∂f ∂f ∂f · (x − x0 ) + · (y − y0 ) + · (z − z0 ) . ∂x ∂y ∂z pontok a felületen vannak, így f (x0 , y0 , z0 ) = 0 és
f (x0 , y0 , z0 ) Az (x0 , y0 , z0 ) és (x, y, z)
f (x0
+
f (x, y, z)
=
0,
ezért az érintosík egyenlete:
∂f ∂f ∂f · (x − x0 ) + · (y − y0 ) + · (z − z0 ) = 0 . ∂x ∂y ∂z Az egyenletet a (15.1) egyenlettel összevetve megállapíthatjuk, hogy a felület Taylor-soros
610
15. Számítógépes graka
közelítésével kapott sík normálvektora éppen
~n =
! ∂f ∂f ∂f , , = grad f . ∂ x ∂y ∂z
(15.4)
A paraméteres felület normálvektorához az izoparametrikus vonalak tanulmányozásá val juthatunk. A v paraméter rögzítésével kapott ~ rv (u) görbe érintojét elsofokú Taylor-soros közelítéssel kapjuk:
~rv (u) = ~rv (u0 + (u − u0 )) ≈ ~rv (u0 ) +
d~ rv du
· (u − u0 ) = ~rv (u0 ) +
∂~r · (u − u0 ) . ∂u
A közelítést az egyenes (15.2) egyenletével összevetve megállapíthatjuk, hogy az érinto irányvektora
∂~r/∂u.
görbék érintoi a felületet érinto síkban vannak, A felületre illeszkedo
görbék érintoinek így a normálvektor a felületre illeszkedo az irányvektoraira meroleges. A normálvektor egyértelmu eloállításához ki kell számítanunk mind az ~ rv (u) érintojét, mind irányvektorainak a vektoriális szorzatát kell képezni, pedig az ~ ru (v) érintojét, és a két érinto mert a vektoriális szorzat mindkét tényezore meroleges eredményt ad. Az ~ r (u, v) felület normálvektora tehát
~n =
∂~r ∂~r × . ∂u ∂v
(15.5)
15.2.5. Görbemodellezés leírásával a virtuális A ponthalmazok paraméteres, illetve implicit egyenletekkel történo világ geometriai tervezését egyenletek megadására, a képszintézis feladatot pedig egyenletek megoldására vezethetjük vissza. Az egyenletek azonban nagyon kevéssé szemléletesek, így a geometriai tervezésnél közvetlenül nem alkalmazhatók. Nyilván nem várhatjuk, egy emberi arc vagy egy sportkocsi felépítése során közvetlenül ezen alakhogy a tervezo zatok egyenleteit adja meg. Indirekt módszerekre van szükségünk, amelyekben a program ol szemléletes információkat kér, amibol az egyenletet automatikusan építi fel. a tervezot Az indirekt megközelítés egyik irányzata vezérlopontokból indul ki, a másik pedig elemi építoelemekkel (kocka, gömb, kúp stb.) és halmazmuveletekkel dolgozik. Tekintsük eloször a pontalapú eljárás alkalmazását görbék deniálására. Legyen a ter által kijelölt vezérlopont-sorozat ~r0 ,~r1 , . . . ,~rm , és keressünk egy ~r vezo
= ~r(t) (t0 ≤ t ≤
tm )
követi a kijelölt pontokat. Egyelore nem követeljük meg, hogy a görbe át is menjen a kijelölt vezérlopontokon.
paraméteres egyenletu görbét, amely
A görbe felépítéséhez a mechanikai rendszerek súlypontjának analógiáját használjuk. Tételezzük fel, hogy egységnyi tömegu homokunk van, amelyet szétosztunk a vezérlopon tok között. Ha egy vezérlopontban van a homok nagy része, akkor a rendszer súlypontja is ennek közelébe kerül. Ha a t paraméter függvényében a homok eloszlását folytonosan úgy változtatjuk, hogy mindig más vezérlopont jusson domináns szerephez, akkor a súlypont egy görbét fut be, egymás után megközelítve a vezérlopontokat. Legyenek a t paraméter mellett a vezérlopontokba helyezett súlyok B0 (t), B1 (t), . . . , Bm (t), amelyeket a görbe bázisfüggvényeinek nevezünk. Mivel egységnyi súlyt osztunk azonosság: szét, megkívánjuk, hogy minden t-re fennálljon a következo m X
Bi (t) i=0
=1.
611
15.2. Ponthalmazok leírása egyenletekkel
1 b0 b1 b2 b3 0.8
0.6
0.4
0.2
0 0.2
0
0.4
0.6
0.8
1
t
15.4. ábra. Négy vezérlopont által deniált Bézier-görbe és bázisfüggvényei (m
= 3).
Adott t-re a görbe pontját ezen mechanikai rendszer súlypontjaként értelmezzük:
Pm m X Bi (t) · ~ ri i=0 ~r(t) = P = Bi (t) · ~ ri . m i= 0
Bi (t)
i=0
Figyeljük meg, hogy azért érdemes mindig egységnyi tömegu homokot szétosztani, mert ekkor a tört nevezoje egységnyi lesz. A vezérlopontokat kis mágnesekként is elképzelhetjük, erovel amelyek a bázisfüggvényeknek megfelelo vonzzák a görbét. Ha a bázisfüggvények sohasem lehet taszító, és a súlypont analógia is teljes (a nem negatívak, akkor ez az ero 1
súly sem lehet negatív). Egy pontrendszer súlypontja a pontok konvex burkában
van, így
nemnegatív bázisfüggvények esetén a görbénk is a vezérlopontok konvex burkában marad. A görbék tulajdonságait a bázisfüggvények határozzák meg. Most két közkedvelt bázisfüggvény rendszert ismertetünk: a Bézier- és a B-spline-görbék bázisfüggvényeit. Bézier-görbe A Renault gyár Pierre Bézier nevu konstruktore a Bernstein-polinomokat javasolta bázis-
= (t + (1 − t))m binomiális tétel szerinti kifejtésével kapunk: ! m X m m (t + (1 − t)) = · ti · (1 − t)m−i . m
függvényeknek, amelyeket az 1
i=0
i
A Bézier-görbe bázisfüggvényei ezen összeg tagjai (i
!
Bezier
Bi,m
(t)
=
m i
= 0, 1, . . . , m):
· ti · (1 − t)m−i .
(15.6)
nyilvánvaló, hogy a bázisfüggvények valóban A Bernstein-polinomok bevezetésébol teljesítik a
Pm
i= 0
Bi (t)
= 1 és Bi (t) ≥ 0 feltételeket a t ∈ [0, 1] tartományban, így a görbe min-
dig a vezérlopontok konvex burkában marad. A görbe bázisfüggvényeit és alakját a 15.4.
1
Deníciószeruen egy pontrendszer konvex burka az a minimális konvex halmaz, amely tartalmazza a pontrend-
szert.
612
15. Számítógépes graka
ábrán láthatjuk. A t
= 0 paraméterértékeknél a legelso bázisfüggvény 1 értéku, a többi pedig = 1 paraméterérték-
vezérlopontból nulla, ezért a görbe az elso indul. Hasonló okok miatt t
nél a görbe az utolsó vezérlopontba érkezik. A többi paraméterértéknél azonban mindegyik bázisfüggvény pozitív, így a görbére az összes vezérlopont együttesen hat. A görbe ezért általában nem megy át a többi vezérloponton. B-spline A második görbénk, a B-spline bázisfüggvényeit lineáris simítások sorozatával konstruál hatjuk meg. A B-spline az m + 1 darab vezérlopontot (k − 1)-edfokú bázisfüggvényekkel súlyozza. A k a görbe rendszáma, amely kifejezi a görbe simaságát. Vegyünk fel egy m + k + 1 paramétersorozatot, amelyet csomóvektornak nevezünk: elemu, nem csökkeno t
= [t0 , t1 , . . . , tm+k ],
t0
≤ t1 ≤ · · · ≤ tm+k . bázis függvény lineáris simítás
B i,1 (t)
1
konstans bázis függvények t0 t1 t2 t3
t4
t5
t6
t7 t8
lineáris simítás
B i,2 (t)
lineáris bázisfüggvények t1
1
B i,3 (t)
t7
t5
lineáris simítás
másodfokú bázisfüggvények t2
1
t6
t5
lineáris simítás
B i,4 (t)
harmadfokú bázisfüggvények t3
t5
o rend két 15.5. ábra. A B-spline bázisfüggvények létrehozása. Egy magasabb rendu bázisfüggvényt a megeloz bázisfüggvényének lineárisan növekvo, illetve lineárisan csökkeno súlyozását követo összeadáegymást követo sával kapjuk. A vezérlopontok száma 5, azaz m ahová m
+1
=
4. Az ábrán nyíllal jelöltük a [tk−1 , tm+1 ] hasznos tartományt,
bázisfüggvény lóg be, amelyek összege itt azonosan 1. Az ábra jobb oldalán a görbék mellett a kis
görbepontokat mutatják. háromszögek a vezérlopontokat, a körök pedig a csomóértékeknek megfelelo
Az elsorend u, i-edik bázisfüggvényt tekintsük 1 értékunek az i-edik paraméterintervallumban, azon kívül pedig zérusnak (15.5. ábra):
(
BS
Bi,1 (t) Ezzel m
=
1, 0
ha ti
≤ t < ti+1 ,
különben .
+ k darab bázisfüggvényünk született, amelyek nulladfokú polinomok, nem nega∈ [t0 , tm+k ) paraméterre azonosan 1. Ezek a bázisfüggvények
tívak és összegük minden t
613
15.2. Ponthalmazok leírása egyenletekkel
annyira alacsonydimenziósak, hogy a súlypont nem is egy görbén halad végig, csak a ve zérlopontokon ugrál. A bázisfüggvények fokszámát, és ezáltal a görbe simaságát úgy növelhetjük, hogy a szint bázisfüggvényeinek az eloállításához két egymást kökövetkezo a jelenlegi készletbol bázisfüggvényt lineáris súlyozással összeadunk (15.5. ábra). Az elso bázisfüggvényt a veto ti
≤ t < ti+1 nem zérus értéku tartományában a lineárisan növekvo (t − ti )/(ti+1 − ti ) kifejezés-
bázisfüggvényt sel szorozzuk, így a hatását lineárisan zérusról egyre növeljük. A következo pedig annak ti+1
≤
t
<
(ti+2 ti+2 tartományában lineárisan csökkeno
− t)/(ti+2 − ti+1 ) függ-
vénnyel skálázzuk. Az így súlyozott bázisfüggvényeket összeadva kapjuk a másodrendu változat sátorszeru bázisfüggvényeit. Figyeljük meg, hogy míg az elsorend u, konstans bázisfüggvények egy-egy intervallumon voltak nem zérus értékuek, a másodrendu, sátorszeru bázisbázisfüggvényekre ez már két intervallumra igaz. Mivel mindig két egymást követo hoztunk létre egy újat, az új bázisfüggvények száma eggyel kevesebb, már csak függvénybol m
elsorend + k − 1 darab van belolük. A két szélso u bázisfüggvény kivételével mindegyik
egyszer pedig csökkeno súlyozással épült be a másodrendu egyszer növekvo, bázisfüggvé intervallum kivételével, azaz a [t1 , tm+k−1 ] tartományban továbbra is nyekbe, így a két szélso 2
fennáll, hogy az ide belógó m
+ k − 1 darab bázisfüggvény összege azonosan 1.
A másodrendu bázisfüggvények elsofokú polinomok. A bázisfüggvények fokszámát, azaz a görbe rendjét, az ismertetett eljárás rekurzív alkalmazásával tetszoleges szintig nö rend bázisfüggvényei az alábbi módon függenek az eloz ot ol: velhetjük. A következo
BS
Bi,k (t)
=
(t
(t) − ti )BBS i,k−1 ti+k−1
− ti
+
(ti+k
(t) − t)BBS i+1,k−1 ti+k
− ti+1
,
ha k
>1.
bázisfüggvényt veszünk, és az elsot a poFigyeljük meg, hogy mindig két egymást követo zitív tartományában (azaz abban a tartományban, ahol nem azonosan zérus) lineárisan nö pedig annak a pozitív tartományában − ti )/(ti+k−1 − ti ) függvénnyel, a következot − t)/(ti+k − ti+1 ) függvénnyel szorozzuk meg. Az eredményeket összeadva megkapjuk a még simább bázisfüggvényeket. A muveletsort (k − 1)-szer meg a [tk−1 , tm+1 ] hasznos tartoismételve k-adrendu bázisfüggvényekhez jutunk, amelyekbol mányba éppen m + 1 darab lóg be, amelyek összege továbbra is azonosan 1. A csomóvektor (t vekvo
(ti+k lineárisan csökkeno
sorozatot megadásánál megengedtük, hogy a csomóértékek ne szigorúan monoton növekvo alkossanak, így az egyes intervallumok hossza akár zérus is lehet. Ez 0/0 jellegu törtekhez vezethet, amelyeket az algoritmus megvalósítása során 1 értékkel kell helyettesíteni. Cox-deBoor algoritA k-adrendu i-edik bázisfüggvény értékét a t helyen a következo mussal számíthatjuk:
2
Akkor mondjuk, hogy a bázisfüggvény egy intervallumba lóg, ha értéke ebben az intervallumban nem azonosan
zérus.
614
15. Számítógépes graka
B-(i, k, t, t) 1 2
if k
=1
B Triviális eset vizsgálata.
then if ti
3
≤ t < ti+1
then return 1
4
else return 0
11
− ti > 0 o lineárisan növekvo súllyal. then b1 ← (t − ti )/(ti+k−1 − ti ) B Eloz else b1 ← 1 B Itt: 0/0 = 1. if ti+k − ti+1 > 0 then b2 ← (ti+k − t)/(ti+k − ti+1 ) B Következo lineárisan növekvo súllyal. else b2 ← 1 B Itt: 0/0 = 1. B ← b1 · B-(i, k − 1, t, t) + b2 · B-(i + 1, k − 1, t, t) B Rekurzió.
12
return B
5 6 7 8 9 10
if ti+k−1
cm
c1
c0
p
m
p
c m+1
1
p
0
c2
p
2
c3
c-1 15.6. ábra. A B-spline interpoláció. A ~ p0 , . . . , ~ pm interpolálandó pontok alapján számítjuk a ~ c−1 , . . . , ~ cm+1 vezér és végpontjai éppen az interpolálandó pontok legyenek. lopont sorozatot úgy, hogy az egyes szegmensek kezdo-
A gyakorlatban a bázisfüggvényeket negyedrendunek választjuk (k
=
4), amelyek har-
madfokú polinomok, a görbe pedig kétszer folytonosan differenciálható. Ennek az a magya mozgásrázata, hogy a meghajlított rudak alakja és a newtoni mozgástörvényeket kielégíto pályák ugyancsak kétszer folytonosan differenciálhatók. Amíg a vezérlopontok száma a görbe rendszámánál nagyobb, az egyes bázisfüggvények csak az érvényes paramétertartomány egy-egy részében nem nulla értékuek. Ez azt jelenti, hogy egy vezérlopont csak a görbe egy részére hat, így megváltoztatása a görbét csak loká tulajdonság, hiszen ekkor a tervezot nem fenyegeti lisan módosítja. Ez egy nagyon kedvezo az a veszély, hogy a görbe egy részének kicsiny módosítása elrontja a görbe alakját távolabb. A negyedrendu B-spline általában nem megy át a vezérlopontjain. Ha interpolációs célokra szeretnénk használni, a görbe vezérlopontjait az interpolálandó pontokból kell kiszámítani. Tegyük fel, hogy egy olyan görbét keresünk, amely a t0
= 0, t1 = 1, . . . , tm =
m
paraméterértékeknél éppen a ~ p0 , ~ p1 , . . . , ~ pm pontokon megy át (15.6. ábra). Ehhez a görbénk interpolációs fel[~ c−1 , ~ c0 , ~ c1 , . . . , ~ cm+1 ] vezérlopontjait úgy kell kitalálni, hogy a következo tétel teljesüljön:
~r(t j ) =
m+1 X
~ci · BBS (t j ) = ~ p j, i, 4
j
= 0, 1, . . . , m .
i=−1
Ez egy m
+ 3 ismeretlenes lineáris egyenletrendszer m + 1 egyenletét határozza meg, tehát
több megoldás is lehetséges. A feladatot teljesen meghatározottá tehetjük, ha még két járulékos feltételt felveszünk, azaz megadjuk például a görbénk deriváltját (mozgásgörbéknél a
615
15.2. Ponthalmazok leírása egyenletekkel
és a végpontban. sebességet) a kezdo A B-spline görbék egy fontos továbbfejlesztésében az i-edik vezérlopont hatását a Bi (t) B-spline bázisfüggvény aktuális paraméter melletti értéke és a vezérlopont saját wi súlyté nyezojének szorzata adja meg. A görbe neve NURBS, amely a jelenlegi geometriai terve zorendszerek egyik legfontosabb eszköze. A szokásos mechanikai analógiánkban a NURBS görbénél egy vezérlopontba wi Bi (t) súlyt teszünk, így a rendszer súlypontja:
Pm
i=0
~r(t) = Pm
BS
wi Bi
j=0
(t)
· ~ri
=
BS
w j B j (t)
m X
NURBS
Bi
(t)
· ~ri .
i=0
A B-spline és a NURBS bázisfüggvények közötti kapcsolat tehát a következo: BS
NURBS
Bi
(t)
wi Bi
= Pm
j=0
(t) BS
w j B j (t)
.
Mivel a B-spline bázisfüggvények polinomok, a NURBS bázisfüggvények két polinom hányadosaként írhatók fel. A NURBS görbék a másodrendu görbéket (például kört, ellipszist stb.) közelítési hiba nélkül képesek leírni.
15.2.6. Felületmodellezés A parametrikus felületek kétváltozós ~ r (u, v) függvényekkel adhatók meg. A függvény köz vetlen megadása helyett véges számú ~ ri j vezérlopontot veszünk fel, amelyeket a bázisfüggvényekkel súlyozva kapjuk meg a felületet leíró függvényeket:
~r(u, v) =
n X m X
i= 0
~ri j · Bi j (u, v) .
(15.7)
j= 0
továbbra is elvárjuk, hogy összegük minden paraméterre egységnyi A bázisfüggvényektol legyen, azaz
Pn Pm i=0
j=0
Bi j (u, v)
=
1 mindenütt fennálljon. Ekkor ugyanis a súlypont ana-
függo Bi j (u, v) lógia szerint most is képzelhetjük úgy, mintha a vezérlopontokban u, v-tol súlyok lennének, és a rendszer súlypontját tekintjük a felület ezen u, v párhoz tartozó pontjának. A Bi j (u, v) bázisfüggvények deníciójánál visszanyúlhatunk a görbéknél megismert eljárásokra. Rögzítsük gondolatban a v paraméter értéket. Az u paraméterértéket szabadon változtatva egy ~ rv (u) görbét kapunk, amely a felületen fut végig. Ezt a görbét a megismert görbetervezési eljárásokkal adhatjuk meg:
~rv (u) =
n X
Bi (u)
· ~ri ,
(15.8)
i=0
ahol a Bi (u) a kívánt görbe bázisfüggvénye. Természetesen, ha más v értéket rögzítünk, akkor a felület más görbéjét kell kapnunk. Mivel egy adott típusú görbét a vezérlopontok egyértelmuen deniálnak, az ~ ri vezérlopon Ahogy a v változik, az ~ toknak függeniük kell a rögzített v paramétertol. ri
= ~ri (v) ugyancsak
616
15. Számítógépes graka
u és v értékek rögzítésével kapott vonalai. 15.7. ábra. Felületek izoparametrikus azaz különbözo
egy görbén fut végig, amit érdemes ugyanazon görbetípussal az ~ ri,0 ,~ ri,2 , . . . ,~ ri,m vezérlopontok segítségével felvenni:
~ri (v) =
m X
B j (v)
· ~ri j .
j= 0
Ezt behelyettesítve a (15.8) egyenletbe, a felület paraméteres függvénye a következo lesz:
~r(u, v) = ~rv (u) =
n X
i=0
m n X m X X = Bi (u)B j (v) · ~ ri j . B j (v) · ~ ri j Bi (u) j=0
i= 0
j= 0
A görbékkel összehasonlítva most a vezérlopontok egy kétdimenziós rácsot alkotnak, a kétváltozós bázisfüggvényeket pedig úgy kapjuk, hogy a görbéknél megismert bázisfüggvények u-val és v-vel parametrizált változatait összeszorozzuk.
15.2.7. Testmodellezés buborékokkal A szabad formájú, amorf testek létrehozását a parametrikus görbékhez és felületekhez hasonlóan a vezérlopontok megadására vezetjük vissza. Rendeljünk minden ~ ri vezérlo ponthoz egy h(Ri ) hatásfüggvényt, amely kifejezi a vezérlopont hatását egy tole Ri
= |~r − ~ri |
pontban. Összetett testnek azokat a pontokat tekintjük, ahol a hatások távolságban lévo összege egy alkalmas T küszöbérték felett van (15.8. ábra):
f (~ r)
=
m X
hi (Ri )
− T ≥ 0,
ahol Ri
= |~r − ~ri | .
i= 0
Egy hatásfüggvénnyel egy gömböt írhatunk le, a gömbök pedig cseppszeruen össze a végtelenben nullához tartó olvadnak (15.8. ábra). A pont hatását bármilyen csökkeno, folytonos függvénnyel kifejezhetjük. Például Blinn a hi (R)
=
ai
· e−b R i
2
hatásfüggvényeket
javasolta a csepp módszerében.
15.2.8. Konstruktív tömörtest geometria A testmodellezés másik irányzata, a konstruktív tömörtest geometria az összetett testeket halmazmuveletek primitív testekbol (egyesítés, metszet, különbség) ismételt alkalmazásával építi fel (15.9. és 19.10. ábra). A primitív testek általában a téglatestet, a gömböt, a gúlát,
617
15.2. Ponthalmazok leírása egyenletekkel
h(R)
T
R
összegzés
kivonás
15.8. ábra. A hatás a távolsággal csökken. Az azonos elojel u hatásfüggvények által leírt gömbök összeolvadnak, elojel a különbözo uek csökkentik egymás hatását.
15.9. ábra. A konstruktív tömörtest geometria alapmuveletei egy f implicit függvényu kúpra és egy g implicit függvényu gömbre: egyesítés (max( f , g)), metszet (min( f , g)) és különbség (min( f , −g)).
U \ U U 15.10. ábra. Összetett objektum felépítése halmazmuveletekkel. A gyökere az összetett objektumot, a levelei a primitíveket azonosítják. A többi csomópont a halmazmuveleteket adja meg (U: egyesítés,
\: különbség).
618
15. Számítógépes graka
a kúpot, a félteret stb. foglalják magukban, amelyek implicit függvényei ismertek. testek implicit függA halmazmuvelet eredményének implicit függvényét a résztvevo kifejezhetjük: vényeibol
•
f és g metszete: min( f , g);
•
f és g egyesítése: max( f , g).
•
f komplemense:
•
f és g különbsége: min( f , −g).
− f.
TeAz implicit függvények segítségével két test közötti átmenet is könnyen kezelheto. gyük fel, hogy két testünk van, például egy kocka és egy gömb, amelyek implicit függvényei egy olyan testet, amely t részben az elso objektumhoz, (1 f1 és f2 . Ebbol
− t) részben pedig
a második objektumhoz hasonlít, az f
mor ph
(x, y, z)
=t·
f1 (x, y, z)
+ (1 − t) ·
f2 (x, y, z)
egyenlettel állíthatunk elo.
Gyakorlatok 15.2-1. Írjuk fel a tórusz paraméteres egyenletét. [0,0,0,0,1,1,1,1] csomóvektorú, 15.2-2. Bizonyítsuk be, hogy a 4 vezérlopontra illeszkedo, negyedrendu B-spline egy Bézier-görbe. 15.2-3. Adjuk meg a lobogó zászló és az egy pontból induló hullámfelület paraméteres egyenleteit, és a normálvektoraikat is egy tetszoleges pontban. két és utolsó két vezérlopont 15.2-4. Bizonyítsuk be, hogy a Bézier-görbe érinti az elso közötti szakaszokat. 15.2-5. Vezessük le a másod-, harmad- és negyedrendu B-spline görbe bázisfüggvényeinek képletét. 15.2-6. Készítsünk algoritmust a Bézier-görbék és B-spline görbék ívhosszának meghatározására két paraméterérték között. Az ívhossz számítás alapján vezessünk végig egy pontot egyenletes sebességgel a görbén.
15.3. Geometriai feldolgozó és tesszellációs algoritmusok A 15.2. alfejezetben megismerkedtünk azokkal a paraméteres és implicit függvényeket használó eljárásokkal, amelyekkel görbéket és felületeket írhatunk le. A képszintézis so rán különösen nagy jelentoségük van a szakaszoknak és a háromszögeknek, ezért ebben a fejezetben olyan eljárásokat ismertetünk, amelyek más reprezentációkat szakaszokkal vagy háromszögekkel közelítenek, illetve, amelyek szakaszokkal vagy háromszögekkel leírt modelleket alakítanak át. A végpontjaikban egymáshoz kapcsolódó szakaszok sorozatát tö gyujteményét röttvonalnak, a háromszögek élekben illeszkedo pedig háromszöghálónak eljárások neve vektorizáció, és kimenete egy, a nevezzük. A görbéket töröttvonallal közelíto tesszeltöröttvonal csúcsait megadó pontsorozat. A felületeket háromszöghálókkal közelíto ahol az egyes háromszögeket lációs algoritmusok pedig háromszögek sorozatát állítják elo, a csúcspontjaikkal adjuk meg. Gyakran a fényforrások hatásának számításához a csúcspontokban az eredeti felület normálvektorait is tároljuk, így végül egy háromszöghöz három
619
15.3. Geometriai feldolgozó és tesszellációs algoritmusok
pont és három normálvektor tartozik. A háromszöghálókat feldolgozó eljárások még további topológiai információkat is felhasználnak, például azt, hogy egy csúcsra mely lapok és élek illeszkednek, és egy élben mely lapok találkoznak.
15.3.1. Sokszög és poliéder 15.2. deníció. Egy sokszög vagy más néven poligon a síknak véges sok szakasszal határolt, korlátos, azaz egyenest nem tartalmazó része. A sokszöget a határoló szakaszokat tartalmazó zárt töröttvonalak felsorolásával deniáljuk. Egy töröttvonalat a csúcsaival adunk meg.
(a)
(b)
(c)
(c) többszörösen össze15.11. ábra. A sokszögek fajtái. (a): egyszeru; (b) nem egyszeru, egyszeresen összefüggo; függo.
15.3. deníció. Egy sokszög egyszeresen összefüggo, ha egyetlen zárt töröttvonal határolja (15.11. ábra). 15.4. deníció. Egy sokszög egyszeru, ha egyszeresen összefüggo, és a határoló töröttvonal nem metszi saját magát (15.11(a) ábra). el, hogy a sokszög belsejében van-e, hogy Egy tetszoleges síkbeli pontról úgy döntheto metszésegy félegyenest indítunk a pontból, és megszámláljuk a sokszög éleivel keletkezo pontokat. Ha a metszéspontok száma páratlan, akkor a pont a sokszög belsejében, egyébként a külsejében van. sokszögbol sokszögháA háromdimenziós térben több, nem feltétlenül egy síkban lévo lókat építhetünk fel. Két sokszöget szomszédosnak mondunk, ha van közös élük. 15.5. deníció. Egy poliéder egy olyan korlátos, azaz egyenest nem tartalmazó térrész, amelyet véges sok sokszög határol. el, hogy a poliéderhez A sokszöghöz hasonlóan, egy tetszoleges pontról úgy döntheto tartozik-e, hogy egy félegyenest indítunk a pontból, és megszámláljuk a poliéder lapjaival metszéspontokat. Ha a metszéspontok száma páratlan, akkor a pont a poliéder keletkezo belsejében, egyébként a külsejében van.
15.3.2. Paraméteres görbék vektorizációja A paraméteres görbék a [tmin , tmax ] intervallumot képezik le a görbe pontjaira. A vektorizáció során a paraméterintervallumot osztjuk fel. A legegyszerubb felbontás a t tartományt N
620
15. Számítógépes graka
részre bontja fel, és az így kialakult ti
= tmin + (tmax − tmin ) · i/N
(i
= 0, 1, . . . , N) paraméte-
kapott ~ rértékekbol r (ti ) pontokra illeszt töröttvonalat.
15.3.3. Egyszer¶ sokszögek háromszögekre bontása A célként megfogalmazott háromszögsorozathoz az egyszeru sokszögek állnak a legköze lebb, ezért eloször ezek háromszögesítésével foglalkozunk. Konvex sokszögekre a feladat egyszeru, egy tetszoleges csúcspontot kiválasztva, és azt az összes többivel összekötve, a Konkáv sokszögeknél azonban ez az út nem járható, felbontás lineáris idoben elvégezheto. szakasz nem a sokszög belsejében fut, ugyanis elofordulhat, hogy a két csúcsot összeköto így ez a szakasz nem lehet valamelyik, a sokszöget felbontó háromszög oldala. denícióval: Kezdjük két alapveto
r2
r1 r0
átló
r3
r4
fül
15.12. ábra. A sokszög átlója és füle.
15.6. deníció. Egy sokszög átlója egy, a sokszög két csúcsát összeköto olyan szakasz, amely teljes egészében a sokszög belsejében van (15.12. ábra). ha azt az összes oldallal megpróbáljuk Az átló tulajdonság egy szakaszra úgy ellenorizhet o, elmetszeni és megmutatjuk, hogy metszéspont csak a végpontokban lehetséges, valamint azt pontja a sokszög belsejében is, hogy az átlójelölt egy tetszoleges, a végpontoktól különbözo van. Ez a tetszoleges pont lehet például a jelölt középpontja. Egy pontról a 15.4.1. pontban el, hogy egy sokszög belsejében van-e. tárgyalt eljárással döntheto 15.7. deníció. A sokszög egy csúcsa fül, ha az adott csúcsot megeloz o és követo csúcsokat összeköto szakasz a sokszög átlója (15.12. ábra). szög 180 foknál nem naNyilván csak azok a csúcsok lehetnek fülek, amelyekben a belso gyobb. Az ilyen csúcsokat konvex csúcsoknak nevezzük, a nem konvexeket pedig konkáv csúcsoknak. alapveto tételeket: Az egyszeru sokszögekre kimondhatjuk a következo 15.8. tétel. Egy egyszeru sokszögnek mindig van átlója. Bizonyítás. Legyen a háromszög legbaloldalibb (minimális x koordinátájú) csúcsa ~ ri , a két szomszédos csúcs pedig ~ ri−1 , illetve ~ ri+1 (15.13. ábra). A legbaloldalibb tulajdonság miatt az ~ ri konvex csúcs. Ha az ~ ri fül, akkor az (~ ri−1 ,~ ri+1 ) szakasz átló (15.13. ábra bal oldala), így az állítást erre az esetre beláttuk. Mivel az ~ ri konvex csúcs, csak akkor nem fül, ha az ~ ri−1 ,
~ri , ~ri+1
háromszög tartalmaz legalább egy poligon csúcspontot (15.13. ábra jobb oldala).
egyenestol Válasszuk ki a tartalmazott csúcspontok közül az ~ ri−1 ,~ ri+1 pontokra illeszkedo
621
15.3. Geometriai feldolgozó és tesszellációs algoritmusok
a legtávolabbit, és helyvektorát jelöljük ~ p-vel. Mivel ~ p-nél nincs az (~ ri−1 ,~ ri+1 ) egyenestol távolabbi csúcs, a ~ p és ~ ri között nem futhat él, tehát a ( ~ p,~ ri ) szakasz átló.
ri-1
ri-1
p
átló ri
ri
átló
y
x
ri+1
ri+1
15.13. ábra. Az átló létezésének bizonyítása egyszeru sokszögre.
15.9. tétel. Egy egyszeru sokszög az átlóival mindig háromszögekre bontható. Ha a sokszög csúcsainak száma n, akkor a keletkezo háromszögek száma n
− 2.
Bizonyítás. A tétel igazolásához teljes indukciót használunk. Az állítás n
=
egyetlen háromszögre nyilván igaz. Tegyük fel, hogy az állítás minden m (m
3 esetre, azaz
= 3, . . . , n − 1)
o tétel szerint az n szögnek van csúcsú sokszögre igaz, és vegyünk egy n szöget. Az eloz átlója, tehát felbonthatjuk egy átlója mentén egy n1 szögre és egy n2 szögre, ahol n1 , n2 és n1
< n, + n2 = n + 2, hiszen az átló végén lévo két csúcs mindkét sokszögben megjelenik. Az
indukciós feltétel értelmében a két sokszöget külön-külön háromszögekre bonthatjuk, ami az eredeti sokszög háromszögekre bontását adja. A háromszögek száma pedig n1 2
− 2 + n2 −
= n − 2. A sokszögek felbontási tételének bizonyítása konstruktív, így közvetlenül sugall egy
felbontási algoritmust: vegyük sorra a lehetséges átlójelölteket, és egy tényleges átló mentén bontsuk fel a sokszöget, végül rekurzívan folytassuk az eljárást a két új sokszögre. Ennek az algoritmusnak a futási ideje
Θ(n3 )
(az átlójelöltek száma ugyanis
Θ(n2 ),
az
Θ(n)). A következokben ezért egy másik, egyszeru algoritkonvex vagy konkáv ~ r0 ,~ r1 , . . . ,~ rn sokszöget háromszögekre
átló ellenorzésének ideje pedig must ismertetünk, amely egy oszt fel.
A háromszögekre bontó fülvágó algoritmus füleket keres, és azokat levágja addig, amíg egyetlen háromszögre egyszerusödik az eredeti sokszög. Az algoritmus az ~ r2 csúcstól indul. o csúcspont fülAmikor egy csúcsot dolgozunk fel, eloször ellenorizzük, hogy a megeloz csúcspontra lépünk. Ha a megeloz o csúcs fül, akkor a két e. Ha az nem fül, a következo o és az aktuális csúcsból egy háromszöget hozunk létre, és a megeloz o csúcsot töröljük eloz o csúcspont éppen a 0 a sokszög csúcsai közül. Ha a törlés után az aktuális csúcsot megeloz csúcspontra lépünk. indexu, akkor a következo amíg talál fület, a befejezodését Az algoritmus egy háromszöget vág le a sokszögbol két fül tétel pedig az biztosítja, hogy minden egyszeru sokszögnek van füle. Az következo származik. alábbi bizonyítása Joseph O'Rourke-tol 15.10. tétel. Egy egyszeru, legalább négy csúcsú sokszögnek mindig van legalább két, nem szomszédos, így egymástól függetlenül levágható, füle.
622
15. Számítógépes graka
Bizonyítás. A 15.9. tétel értelmében minden egyszeru sokszög háromszögekre bontható háromszögek oldalai a sokszög élei vagy pedig átlói. A háromszöúgy, hogy a keletkezo geket feleltessük meg egy gráf csomópontjainak, és két csomópont közé akkor vegyünk fel gráf összefüggo, és egy élt, ha a két háromszög egy sokszögátlón osztozik. A keletkezo nincsenek benne körök, tehát fagráf, amelynek neve duális fa. A sokszög csúcsainak száma Minden, legalább két legalább négy, így a fagráf csomópontjainak száma legalább ketto. 3
csomópontból álló fagráfnak legalább két levele
háromszövan. A leveleknek megfelelo
gek pedig fülek.
A két fül tétel miatt az algoritmusunk O(n) lépésben mindig talál levágandó fület, 2
amelynek eltávolításával a sokszög csúcsainak száma eggyel csökken, így az eljárás O(n ) lépésben befejezodik.
15.3.4. Paraméteres felületek tesszellációja A paraméteres felületek a paramétertartomány egy [umin , umax ]
× [vmin , vmax ] téglalapját ké-
pezik le a felület pontjaira.
rv (u)
ru (v) 15.14. ábra. Paraméteres felületek tesszellációja.
A tesszelláció elvégzéséhez a paramétertéglalapot háromszögesítjük. A paraméter há háromszögek csúcsaira alkalmazva a paraméteres egyenletet, éppen a felületet közelíto romszöghálóhoz jutunk. A legegyszerubb felbontás az u tartományt N részre, a v-t pedig M részre bontja fel, és az így kialakult
[ui , v j ]
=
umin
i
+ (umax − umin ) , N
vmin
+ (vmax − vmin )
j
M
párokból kapott pontok közül az ~ r (ui , v j ), ~ r (ui+1 , v j ), ~ r (ui , v j+1 ) ponthármasokra, ~r(ui+1 , v j ), ~r(ui+1 , v j+1 ), ~r(ui , v j+1 ) ponthármasokra háromszögeket illeszt.
illetve az
A tesszelláció lehet adaptív is, amely csak ott használ kis háromszögeket, ahol a felület és bontsuk gyors változása ezt indokolja. Induljunk ki a paraméter tartomány négyzetébol fel két háromszögre. A háromszögesítés pontosságának vizsgálatához a paramétertérben háromszög élfelezoihez háromlévo tartozó felületi pontokat összehasonlítjuk a közelíto
3
A levél olyan csúcs, amelyhez pontosan 1 él kapcsolódik.
623
15.3. Geometriai feldolgozó és tesszellációs algoritmusok
pontjaival, azaz képezzük a következo távolságot (15.15. ábra): szög élfelezo
u1 + u2 v1 + v2 ~r(u1 , v1 ) + ~r(u2 , v2 ) , − , ~r 2 2 2
ahol (u1 , v1 ) és (u2 , v2 ) az él két végpontjának a paramétertérbeli koordinátái.
hiba
15.15. ábra. A tesszellációs hiba becslése.
Ha ez a távolság nagy, az arra utal, hogy a paraméteres felületet a háromszög rosszul közelíti, tehát azt fel kell bontani kisebb háromszögekre. A felbontás történhet úgy, hogy felezopont a háromszöget két részre vágjuk a legnagyobb hibával rendelkezo és a szemben csúcs közötti súlyvonal segítségével, vagy pedig úgy, hogy a háromszöget négy részre lévo vágjuk a három felezovonala segítségével. Az adaptív felbontás nem feltétlenül robusztus, ugyanis elofordulhat, hogy a felezoponton a hiba kicsi, de a háromszög mégsem közelíti jól a paraméteres felületet. két háromszög Az adaptív felbontásnál elofordulhat, hogy egy közös élre illeszkedo ponton átmeno súlyvonallal felbontjuk, de a másikat nem, így közül az egyiket az élfelezo háromszög nem illeszkedik a másik oldalon lévo két a felbontás után az egyik oldalon lévo pontokat T csomópontmásikhoz, azaz a felületünk kilyukad. Az ilyen problémás élfelezo nak nevezzük (15.16. ábra).
felosztás T csomópont új T csomópont rekurzív felosztás 15.16. ábra. T csomópontok és kiküszöbölésük eroszakos felosztással.
Amennyiben a felosztást mindig csak arra az élre végezzük el, amelyik megsérti az eloírt, csak az él tulajdonságain alapuló hibamértéket, T csomópontok nem jelenhetnek meg. Ha a felosztásban az él tulajdonságain kívül a háromszög egyéb tulajdonságai is szerepet játszanak, akkor viszont fennáll a veszélye a T csomópontok feltunésének, amit úgy hárítha háromszögre is kieroszakoljuk tunk el, hogy ekkor rekurzívan arra az illeszkedo a felosztást, amelyre a saját hibakritérium alapján nem tettük volna meg.
624
15. Számítógépes graka
15.3.5. Töröttvonal és felület simítás, felosztott görbék és felületek Ebben a pontban olyan algoritmusokat ismertetünk, amelyek a töröttvonal és sokszögháló modelleket simítják, azaz a töröttvonalat és sokszöghálót több vonalból, illetve lapból álló olyan változatokkal cserélik fel, amelyek kevésbé tunnek szögletesnek.
ri hi-1
ri+1 hi
ri ’
ri-1 =1/2 Σ
=1/2 Σ +1/4 Σ
15.17. ábra. Felosztott görbe létrehozása: minden lépésben felezopontokat veszünk fel, majd az eredeti csúcspon tokat a szomszédos felezopontok és a csúcspont súlyozott átlagára helyezzük át.
Tekintsük eloször az ~ r0 , . . . ,~ rm töröttvonalat. Egy látszólag simább töröttvonalhoz ju a vezérlopontokat tunk a következo, megduplázó eljárással (15.17. ábra). Minden szakaszt
megfelezünk és a felezopontokban egy-egy új ~ h0 , . . . , ~ hm−1 vezérlopontot veszünk fel. Bár
már kétszer annyi vezérlopontunk van, a görbénk éppen annyira szögletes, mint eredetileg volt. A régi vezérlopontokat ezért úgy módosítjuk, hogy azok a régi helyük és a két oldalu felezopontok kon lévo közé kerüljenek, az alábbi súlyozással:
~ri 0 =
1 2
1 1 ~ri + ~hi−1 + ~hi = 4
4
3 4
1
1
8
8
~ri + ~ri−1 + ~ri+1 .
Az új töröttvonal valóban sokkal simábbnak látszik. Ha még ez sem elégít ki bennünket, az eljárást tetszoleges mélységig ismételhetjük. Ha végtelen sokszor tennénk ezt, akkor éppen a B-spline-t állítanánk elo.
=1/4 Σ
=1/4 Σ +1/4 Σ
=1/2
+1/16 Σ
+1/16 Σ
környeze15.18. ábra. A CatmullClark-felosztás egy lépése. Eloször a lappontokat számítjuk, majd az élfelezok tében veszünk fel átlagolással egy pontot, végül pedig az eredeti csúcspontokat módosítjuk a környezet átlagának megfeleloen.
háromdimenziós hálókra, amelynek eredménye Az eljárás közvetlenül kiterjesztheto
15.3. Geometriai feldolgozó és tesszellációs algoritmusok
625
15.19. ábra. Az eredeti háló, valamint egyszer, kétszer és háromszor felosztott változatai.
a CatmullClark felosztott felület. Induljunk ki egy háromdimenziós négyszöghálóból (15.18. ábra) (az algoritmus nemcsak négyszögeket képes felosztani, de a létrehozott lapok lépésként minden él közepén felveszünk egy-egy élpontot mint mindig négyszögek). Elso az él két végpontjának az átlagát, és minden lap közepén egy-egy lappontot mint a négyszög négy csúcspontjának az átlagát. Az új élpontokat a lappontokkal összekötve ugyanazt a felületet négyszer annyi négyszöggel írtuk le. A második lépésben kezdodik a simítás, lapok lappontjai alapján úgy, hogy az amikor az élpontokat módosítjuk az élhez illeszkedo csúcspont átlaga legyen. Ugyanezt új élpont éppen a két lappont és az él két végén levo két lap négy-négy eredeti saaz új élpontot úgy is megkaphatjuk, hogy az élre illeszkedo rokpontjának, valamint az él két végpontjának képezzük az átlagát (azaz az él végpontjait háromszor szerepeltetjük az átlagban). A simítás utolsó lépésében az eredeti csúcspontok új helyét súlyozott átlaggal határozzuk meg, amelyben az eredeti csúcspont 1/2 súlyt, az illesz élek összesen 4 módosított élpontja és az illeszkedo lapok összesen 4 lappontja pedig kedo 1/16 súlyt kap. Az eljárást addig ismételjük, amíg a felület simasága minden igényünket ki nem elégíti (15.19. ábra). Ha a háló egyes éleinek és csúcsainak környezetét nem szeretnénk simítani, akkor a éleken túl lévo pontokat nem vonjuk be az átlagolási muveletekbe. megorzend o
-1/16-w
1/2
1/2
-1/16-w
-1/16-w
1/8+2w
1/8+2w
-1/16-w
15.20. ábra. Az új élpont meghatározása és a háromszög pillangó felosztása.
626
15. Számítógépes graka
A CatmullClark-felosztással kapott felület általában nem megy át az eredeti háló pillangó feloszcsúcspontjain. Ezt a hátrányt küszöböli ki a háromszöghálókon muköd o pontjainak közelébe egy-egy új élpontot tás. A pillangó felosztás a háromszögek élfelezo helyez, majd az eredeti háromszögeket négy új háromszöggel váltja fel. Az új háromszö pontjai gek csúcsai egyrészt az eredeti háromszög csúcsai, másrészt a módosított élfelezo háromszögek csúcspontjai és (15.20. ábra). Az élpontok kialakításában az élre illeszkedo az ezen két háromszöggel közös élt birtokló még további négy háromszög vesz részt. Az élpontra ható háromszögek elrendezése egy pillangóra emlékeztet, ami magyarázza az eljárás elnevezését. Az élpont koordinátáit az él végpontjainak koordinátáiból számítjuk 1/2-es két háromszög harmadik csúcsaiból 1/8 súlyozással, az élre illeszkedo
+ 2w
súlyozással,
két háromszöghöz tapadó négy háromszögnek az illeszkedo hávalamint az élre illeszkedo csúcsaiból −1/16−w súlyozással. A w a muvelet romszögön kívül lévo paramétere, amellyel azt állíthatjuk be, hogy az eljárás mennyire görbítse meg a felületet az élek környezetében. A w
= −1/16-os
beállítás megtartja a háló szögletességét, a w
=
0-t használó felosztás
pedig erosen lekerekíti az eredeti éleket.
15.3.6. Implicit felületek tesszellációja Egy implicit egyenlettel leírt test felületének háromszöghálós közelítését úgy állíthatjuk elo, hogy elegendoen sur un olyan pontokat keresünk, amelyekre az f (x, y, z)
≈
0 teljesül, és a
közeli pontokat összekötve háromszöghálót építünk fel. Eloször az f függvényt a háromdimenziós koordinátarendszer rácspontjaiban kiértékeljük és az eredményt egy háromdimenziós tömbben, úgynevezett voxeltömbben tároljuk. A továbbiakban két rácspontot szomszédosnak nevezünk, ha két koordinátájuk páronként megegyezik, a harmadik koordináták különbsége pedig éppen az adott tengely menti rácsállandó. A rács pontjaiban ismerjük a függvény pontos értékét, a szomszédos rácspontok közötti változást pedig általában lineárisnak tekintjük. Az árnyaláshoz szükséges normálvektorokat a mintapontokban az f függvény gradienseként számítjuk (15.4. egyenlet), amelyet a rácspontok között ugyancsak lineárisan interpolálunk. A voxeltömb alkalmazása azt jelenti, hogy az eredeti f függvény helyett a továbbiak arra utal, ban annak egy voxelenként tri-lineáris közelítésével dolgozunk (a tri-lineáris jelzo függvényben bármely két koordinátaváltozó rögzítésével a harmadik koorhogy a közelíto dinátában a függvény lineáris). A lineáris közelítés miatt egy két szomszédos rácspont felületet, hiszen a lineáris függvénynek közötti él legfeljebb egyszer metszheti a közelíto legfeljebb egyetlen gyöke lehet. A rácspontokat olyan sur un kell felvenni, hogy a tri-lineáris közelítés során ne veszítsünk el gyököket, azaz a felület topológiája ne változzon. módszer neve masírozó kockák algoritmus. Az A felületet háromszöghálóval közelíto algoritmus a mintavételezett érték elojele alapján minden mintavételezési pontra eldönti, hogy az a test belsejében vagy azon kívül van-e. Ha két szomszédos mintavételezési pont típusú, akkor közöttük felületnek kell lennie. A határ helyét és az itt érvényes noreltéro málvektort a szomszédos mintavételezési pontok közötti élen az értékek alapján végzett lineáris interpolációval határozhatjuk meg. Ha az egyik mintavételezési pont helyvektora
~r1 , a szomszédos mintavételi ponté pedig ~r2 , és az f implicit függvény a két pontban eltéro elojel u, akkor a tri-lineáris felület és az (~ r1 ,~ r2 ) szakasz ~ ri metszéspontja, valamint a felület ~ni normálvektora:
15.3. Geometriai feldolgozó és tesszellációs algoritmusok
627
15.21. ábra. Egy voxelenkénti tri-lineáris implicit függvényu felület és egy voxel lehetséges metszetei. A 256-ból eset választható ki, amelyekbol a többiek forgatással eloállíthatók. ez a 15 topológiailag különbözo Az ábrán az azonos elojel u mintavételezett értékeket körrel jelöltük.
f (~ r2 )
f (~ r1 ) + ~r2 · , − f (~r1 ) f (~ r2 ) − f (~ r1 ) f (~ r1 ) f (~ r2 ) ~ni = grad f (~r1 ) · + grad f (~r2 ) · . f (~ r2 ) − f (~ r1 ) f (~ r2 ) − f (~ r1 )
~ri = ~r1 ·
f (~ r2 )
összeáll a köVégül az éleken kijelölt pontokra háromszögeket illesztünk, amelyekbol felület. A háromszögillesztéshez gyelembe kell venni, hogy a tri-lineáris felület a zelíto kocka éleinek mindegyikét legfeljebb egyszomszédos mintavételezési pontokra illeszkedo mintavételezési pontszer metszheti. Metszéspont akkor keletkezik, ha az él két végén lévo elojel ban a függvényérték eltéro u. A kocka 8 csúcsán érvényes elojelek alapján 256 eset végül 15 topológiailag különbözo konguráció különítheto el (15.21. lehetséges, amibol ábra). Az algoritmus sorra veszi az egyes voxeleket és megvizsgálja a csúcspontok elojeleit. Rendeljünk a negatív elojelhez 0 kódbitet, a nem negatívhoz 1-et. A 8 kódbit kombinációja kódszónak tekintheto, amely éppen az aktuális metszési esetet egy 0255 tartományba eso azonosítja. A 0 kódszavú esetben az összes sarokpont a testen kívül van, így a felület a voxelt nem metszheti. Hasonlóan, a 255 kódszavú esetben minden sarokpont a test belsejében található, ezért a felület ekkor sem mehet át a voxelen. A többi kódhoz pedig egy táblázatot építhetünk fel, amely leírja, hogy az adott konguráció esetén mely kockaélek végpont elojel jai eltéro uek, ezért metszéspont lesz rajtuk, valamint azt is, hogy a metszéspontokra miként kell háromszöghálót illeszteni.
628
15. Számítógépes graka
Gyakorlatok 15.3-1. Igazoljuk a két fül tételt teljes indukcióval. 15.3-2. Készítsünk adaptív görbetesszellációs algoritmust. 15.3-3. Bizonyítsuk be, hogy a CatmullClark felosztási módszer a B-spline görbéhez, illetve felülethez konvergál. 15.3-4. Készítsünk egy táblázatot a masírozó kockák algoritmus számára, amely minden háromszögek számát, és azt, hogy a háromszögek csúcskódszóhoz megadja a keletkezo pontjai mely kockaélekre illeszkednek. 15.3-5. Készítsünk olyan masírozó kocka algoritmust, amely nem igényli az implicit függvény gradiensét a mintavételi pontokban, hanem azt is az implicit függvény mintáival becsli.
15.4. Tartalmazási algoritmusok A modellek feldolgozása során gyakran kell megválaszolnunk azt a kérdést, hogy egy alakzat tartalmazza-e egy másik alakzat valamely részét. Ha csak igen/nem válaszra vagyunk is kell állítani a tartalmazott kíváncsiak, akkor tartalmazás vizsgálatról beszélünk. Ha elo alakzat azon részét, amely a másik alakzat belsejében van, akkor az algoritmuscsalád neve vágás. A tartalmazás vizsgálatot gyakran diszkrét ideju ütközésfelismerésnek is nevezzük. Az ütközéseket ugyanis közelítoleg vizsgálhatjuk úgy is, hogy csak diszkrét idopillanatokban nézünk rá a virtuális világ elemeire, és az ütközésekre utólag abból következtetünk, hogy megvizsgáljuk, tartalmazzák-e az alakzatok más alakzatok részeit. A diszkrét ideju ütkö zésfelismerés hibázhat. Ha az objektumok sebessége a mintavételezési idohöz képest nagy, akkor elofordulhat, hogy nem veszünk észre ütközéseket. Az ütközési feladat robusztus és eljárások szükségesek, amelyek az pontos megoldásához folytonos ideju ütközésfelismero ütközés idopontját is kiszámítják. A folytonos ideju ütközésfelismerést a sugárkövetésre (15.6. pont) építhetjük, így ebben a fejezetben csak a pont tartalmazással, a poliéderek közötti diszkrét ideju ütközésfelismeréssel, és végül néhány egyszeru alakzat vágásával foglalkozunk.
15.4.1. Pont tartalmazásának vizsgálata Az f implicit függvényu test azon (x, y, z) pontokat tartalmazza, amelyekre az f (x, y, z)
≥0
egyenlotlenség teljesül, így az adott pont koordinátáit az implicit függvénybe helyettesítve, az eredmény elojele alapján dönthetünk a tartalmazásról. Féltér A féltér pontjait a (15.1) egyenlet alapján az (~ r
− ~r0 ) · ~n ≥ 0,
nx
· x + ny · y + nz · z + d ≥ 0
egyenlotlenséggel adhatjuk meg, ahol a határoló sík normálvektora befelé mutat.
(15.9)
629
15.4. Tartalmazási algoritmusok
Konvex poliéder síkok által határolt félterek metBármely konvex poliéder eloállítható a lapjaira illeszkedo szeteként (15.22. ábra bal oldala). Minden lap síkja tehát a teret két részre bontja, egy belso tartományra. Vessük össze a ponrészre, amelyikben maga a poliéder található, és egy külso tot a poliéder lapjaival, pontosabban azok síkjaival. Ha a pontunk minden sík tekintetében részben van, akkor a pont a poliéderen belül van. Ha viszont valamely sík esetén a a belso tartományban van, akkor a pont nem lehet a poliéder belsejében. külso
kívül belül
konvex poliéder
konkáv poliéder
1
2
pont belül kívül
kívül belül
15.22. ábra. Poliéder-pont tartalmazás vizsgálat. Konvex poliéder akkor tartalmaz egy pontot, ha a pont minden lapsíkjának ugyanazon az oldalán van, mint maga a test. Konkáv poliéderre egy félegyenest indítunk a pontból és megszámláljuk a metszéspontokat. Páratlan számú metszés esetén a pont belül van, páros számú metszéskor pedig kívül.
Konkáv poliéder A 15.22. ábra jobb oldalán látható módon indítsunk egy félegyenest a vizsgált pontból a végtelen felé, és próbáljuk elmetszeni a poliéder lapjait a félegyenessel (a metszéspontok számításához a 15.6. szakaszban a sugárkövetéshez kidolgozott eljárások használhatók). Ha páratlan számú metszéspontot számolunk össze, akkor a poliéder belsejében, egyébként pedig azon kívül van a pontunk. A numerikus pontatlanságok miatt a lapok találkozásánál gondot jelenthet annak eldöntése, hogy félegyenesünk itt hány lapot is metszett egyszerre. Ha ilyen helyzetbe kerülünk, akkor a legegyszerubb egy olyan új félegyenest választani, amely elkerüli a lapok találkozását. Sokszög Természetesen a konkáv poliédereknél megismert eljárás a síkban is használható annak el döntéséhez, hogy egy tetszoleges sokszög tartalmaz-e egy adott, ugyanebben a síkban lévo pontot. A síkon egy félegyenest indítunk a végtelen felé, és megszámláljuk a sokszög élei metszéspontokat. Ha a metszéspontok száma páratlan, akkor a pont a sokszög vel keletkezo belsejében, egyébként a külsejében van. Ezen kívül a konvex lapoknál ellenorizhetjük, hogy a pontból a lap éleinek a látószögét összegezve 360 fokot kapunk-e, vagy megvizsgálhatjuk, hogy minden élre a pont ugyanazon az oldalon van-e, mint a lap többi csúcspontja. Az algoritmus muködését részleteiben egy speciális esetre, a háromszögre tárgyaljuk.
630
15. Számítógépes graka
Háromszög
Tekintsünk egy háromszöget ~ a, ~ b és ~ c helyvektorú csúcsokkal, és egy, a háromszög síkjában ~ lévo p pontot. A pont akkor van a háromszögön belül, ha a háromszög mind a három oldalegyeneséhez viszonyítva ugyanazon az oldalon van, mint a harmadik csúcs. A (~ b −~ a) × ( ~ p −~ a)
~ egyenes két oldalán lévo ~p pontokra ellentétes irányú, így ezen vektoriális szorzat az ab
~ vektor irányát felhasználhatjuk a pontok osztályozására (amennyiben a ~ p pont éppen az ab egyenesen lenne, a vektoriális szorzat eredménye zérus). A (~ b
− ~a) × ( ~p − ~a) vektor irányát = (~b − ~a) × (~c − ~a) vektor irányával kell összevetni, amelyben a vizsgált ~p pontot a háromszög harmadik ~ c csúcsával cseréltük fel. Vegyük észre, hogy ez az ~ n vektor éppen a tehát az ~ n
háromszög síkjának normálvektora (15.23. ábra). Két vektorról például úgy állapíthatjuk meg, hogy azonos irányúak (bezárt szögük nulla), vagy ellentétesek (bezárt szögük 180 fok), hogy képezzük a skaláris szorzatukat, és megvizsgáljuk az eredmény elojelét. Azonos irányú vektorok skaláris szorzata pozitív, az
ellentétes irányúaké negatív. Tehát, ha a ((~ b −~ a) × ( ~ p −~ a)) · ~ n skaláris szorzat pozitív, akkor
~ egyenesnek ugyanazon az oldalán van, mint a ~c, ha negatív, akkor az ellentétes a ~ p az ab
~ egyenesre illeszkedik. A vizsgálatot mindhárom ololdalon, ha pedig zérus, akkor a ~ p az ab
dalegyenesre el kell végezni, és a ~ p pont akkor lesz a háromszög belsejében, ha mindhárom alábbi feltétel teljesül: ((~ b
0
((~ c
0
− ~a) × ( ~p − ~a)) · ~n ≥ − ~b) × ( ~p − ~b)) · ~n ≥ ((~ a −~ c) × ( ~ p −~ c)) · ~ n ≥
0
, , .
(15.10)
A vizsgálat robusztus, azaz akkor is helyes eredményt ad, ha a numerikus pontatlansá gok miatt a ~ p pont nincs pontosan a háromszög síkján, csak a síkra meroleges háromszög alapú hasábban.
( b- a ) x (p- a ) n b- a
a p- a
b
p a- c c
p- c ( a- c ) x ( p- c )
~ és bc ~ ~ 15.23. ábra. Háromszög-pont tartalmazás. Az ábra azt az esetet illusztrálja, amikor a síkon levo p pont az ab balra, a ca pedig jobbra helyezkedik el, azaz nincs bent a háromszög belsejében. ~ egyenestol egyenesektol
Az egyenlotlenségrendszer kiértékelését gyorsíthatjuk, ha a háromdimenziós tér helyett annak kétdimenziós vetületén dolgozunk. Vetítsük le a vizsgált ~ p pontot, és vele együtt a háromszöget valamelyik koordinátasíkra, és ezen a síkon végezzük el a háromszög három ol-
631
15.4. Tartalmazási algoritmusok
dalára a tartalmazás vizsgálatot. A koordinátasík kiválasztásakor ügyelnünk kell arra, hogy a legnagyobb legyen és semmi háromszög vetülete a numerikus pontosság érdekében a leheto esetre se zsugorodjon egy szakasszá. Ha a normálvektor három Descartes-koordinátája közül az nz a legnagyobb abszolút értéku, akkor a legnagyobb vetület az xy síkon keletkezik. A következokben csak ezzel az esettel foglalkozunk. Ha n x vagy ny lenne maximális abszolút értéku, akkor az yz, illetve az xz síkon a vizsgálat hasonlóan elvégezheto.
b c
vagy
a c
1.eset: ( bx - ax ) > 0
b
a b
a 2.eset: ( bx - ax ) < 0
vagy b
c
c
a
~ bal vagy jobb 15.24. ábra. Háromszög-pont tartalmazás vizsgálata az xy vetületen. A ~ c harmadik csúcs az ab oldalán helyezkedhet el, amit a csúcspontok sorrendjének felcserélésével mindig a baloldali esetre vezetünk vissza.
Eloször átalakítjuk a csúcsok sorrendjét úgy, hogy ~ a-ból ~ b-be haladva a ~ c pont mindig
~ egyenes egyenletét: a bal oldalon helyezkedjen el. Ehhez eloször vizsgáljuk meg az ab − ay · (x − b x ) + by = y . bx − ax by
c pont akkor van az egyenes bal oldalán, ha x A 15.24. ábra alapján a ~ egyenes felett van: by bx Mindkét oldalt (b x
=
c x -nél cy az
− ay · (c x − b x ) + by < cy . − ax
− a x )-szel szorozva: (by
− ay ) · (c x − b x ) < (cy − by ) · (b x − a x ) .
A második esetben a meredekség nevezoje negatív. A ~ c pont akkor van az egyenes bal oldalán, ha x
= c x -nél cy az egyenes alatt van: by bx
A negatív (b x
− ay · (c x − b x ) + by > cy . − ax
− a x ) nevezovel való szorzás miatt a relációs jel megfordul: (by
− ay ) · (c x − b x ) < (cy − by ) · (b x − a x ) ,
azaz mindkét esetben ugyanazt a feltételt kaptuk. Ha ez a feltétel nem teljesül, akkor ~ c nem
~ egyenes bal oldalán, hanem a jobb oldalán helyezkedik el. Ez pedig azt jelenti, hogy ~c az ab
~ egyenes bal oldalán található, tehát az ~a és ~b sorrendjének cseréjével biztosítható, hogy a ba
~ egyenes bal oldalán tartózkodjon. Fontos észrevenni, hogy ebbol következik az is, ~c az ab
632
15. Számítógépes graka
~ egyenes, valamint a ~b a ca ~ egyenes bal oldalán helyezkedik el. hogy az ~ a a bc Az algoritmus második lépésében pedig azt ellenorizzük, hogy a ~ p pont mindhárom oldalra a bal oldalon van-e, mert ekkor a háromszög tartalmazza a pontot, egyébként pedig nem:
− ay ) · ( p x − b x ) ≤ ( py − by ) · (b x − a x ) , − by ) · ( p x − c x ) ≤ ( py − cy ) · (c x − b x ) , (ay − cy ) · ( p x − a x ) ≤ ( py − ay ) · (a x − c x ) .
(by
(cy
(15.11)
15.4.2. Poliéder-poliéder ütközésvizsgálat Két poliéder ütközhet egymással úgy, hogy az egyikük egy csúcsa a másik egy lapjával találkozik, és ha semmi sem állítja meg, akkor a csúcs a másik test belsejébe hatol (15.25. ábra Eloször bal oldala). Ez az eset a korábban tárgyalt tartalmazás vizsgálattal felismerheto. az poliéder összes csúcsára ellenorizzük, elso hogy a másik poliéder tartalmazza-e, majd a két poliéder belsejében poliéder szerepét felcserélve vizsgáljuk, hogy a második csúcsai az elso vannak-e.
csúcs behatolás
él behatolás
15.25. ábra. Poliéder-poliéder ütközésvizsgálat. Az ütközési esetek csupán egy részét ismerhetjük fel az egyik test csúcsainak a másik testtel való összevetésével. Ütközés keletkezhet úgy is, hogy csak az élek hatolnak a másik testbe, de a csúcsok nem.
ütközésen kívül elofordulhat, A csúccsal történo hogy két poliéder élei a másikba hatolnak anélkül, hogy csúcsaik a másik belsejébe kerülnének (15.25. ábra jobb oldala). Ennek felismeréséhez az egyik poliéder összes élét össze kell vetni a másik poliéder összes lapjá val. Egy él és lap tekintetében a (15.9) egyenlotlenség felhasználásával eloször ellenorizzük, hogy az él két végpontja a lap síkjának két ellentétes oldalán van-e. Ha igen, akkor kiszámítjuk az él és a lap síkjának a metszéspontját, végül pedig eldöntjük, hogy a metszéspont a lapon belül van-e. Vegyük észre, hogy az él behatolás és egy tetszoleges pont tartalmazásának ellenorzése együttesen magában foglalja a csúcs behatolás esetét is, tehát a csúcsok egyenkénti vizsgálata szükségtelennek látszik. Azonban csúcs behatolás nélküli él behatolás ritkábban ráadásul a csúcs behatolását kevesebb számítással is felismerhetjük, így érdemes fordul elo, eloször mégis a csúcs behatolást vizsgálni. A poliéderek ütközésvizsgálata során az egyik poliéder összes élét a másik poliéder összes lapjával össze kell vetni, amely négyzetes ideju algoritmushoz vezet. Szerencsére gyorsítható. Kea módszer a befoglaló keretek (15.6.2. pont) alkalmazásával jelentosen ressünk minden objektumhoz egy olyan egyszeru alakzatot, amely tartalmazza azt. Különösen népszeruek a befoglaló gömbök, illetve téglatestek. Ha a befoglaló alakzatok nem
633
15.4. Tartalmazási algoritmusok
találkoznak, akkor nyilván a befoglalt objektumok sem ütközhetnek. Amennyiben a befoglaló alakzatok egymásba hatolnak, akkor folytatni kell a vizsgálatot. Az egyik objektumot összevetjük a másik befoglaló alakzatával, és ha itt is ütközés mutatkozik, akkor magával az és az ütközésvizsgáobjektummal. Remélhetoleg ezen utóbbi eset nagyon ritkán fordul elo, részét a befoglaló alakzatokkal gyorsan el lehet intézni. latok dönto
15.4.3. Vágási algoritmusok A vágás egy vágó és egy vágandó alakzatot használ, és a vágandóból eltávolítja az összes olyan részt, amely a vágó külsejében van. A vágás megváltoztathatja a vágandó alakzat jellegét, így nehézséget okozhat, hogy a vágás után már nem lehet leírni olyan típusú függ vénnyel, mint a vágás elott. Ezért általában csak olyan vágó és vágandó alakzatokat engedünk meg, ahol a vágandó jellege (azaz a függvény típusa) a vágás után sem módosul. A továbbiakban feltételezzük, hogy a vágó alakzat féltér, általános, illetve speciális tulajdonságú poliéder, a vágandó pedig pont, szakasz, illetve sokszög. o pont algoritHa a vágandó alakzat egy pont, akkor a tartalmazást ellenorizzük az eloz függoen musaival, és annak eredményétol a pontot eltávolítjuk vagy megtartjuk. Szakaszok vágása féltérre Tekintsük az ~ r1 és ~ r2 végpontú ~ r (t)
= ~r1 · (1 − t) + ~r2 · t, (t ∈
[0, 1]) paraméteres egyenletu
származtatott szakaszt és a (15.1) egyenletbol (~ r
− ~r0 ) · ~n ≥ 0,
nx
· x + ny · y + nz · z + d ≥ 0
egyenlotlenséggel adott félteret. Három esetet kell megkülönböztetni: 1.
Ha a szakasz mindkét végpontja a féltér belsejében van, akkor a teljes szakasz belso pontokból áll, így megtartjuk.
2.
Ha a szakasz mindkét végpontja a féltér külsejében van, akkor a szakasz minden pontja pont, így a vágás a teljes szakaszt eltávolítja. külso
3.
pont, a másik végpontja belso pont, akkor ki kell Ha a szakasz egyik végpontja külso végpontot számítani a szakasz és a féltér határoló síkjának metszéspontját, és a külso fel kell cserélni a metszésponttal. A metszéspontot megkaphatjuk, ha a szakasz egyenletét a féltér határoló síkjának egyenletébe helyettesítjük, és az egyenletet az ismeretlen paraméterre megoldjuk: (~ r1
· (1 − ti ) + ~r2 · ti − ~r0 ) · ~n = 0, =⇒
ti
=
(~ r0 (~ r2
− ~r1 ) · ~n . − ~r1 ) · ~n
A ti paramétert a szakasz egyenletébe visszahelyettesítve a metszéspont koordinátáit is eloállíthatjuk.
Sokszögek vágása féltérre pontok-e A vágás során egyrészt az egyes csúcspontokat kell megvizsgálni, hogy azok belso pont, akkor a vágott sokszögnek is egyben csúcspontja. vagy sem. Ha egy csúcspont belso pont, nyugodtan eldobhatjuk. Másrészt vegyük észre, hogy Ha viszont a csúcspont külso
634
15. Számítógépes graka
az eredeti sokszög csúcsain kívül a vágott sokszögnek lehetnek új csúcspontjai is, amelyek az élek és a féltér határoló síkjának a metszéspontjai. Ilyen metszéspont akkor keletkezhet, csúcs közül az egyik belso, míg a másik külso pont. A csúcsok ha két egymást követo pont a határoló egyenkénti vizsgálata mellett tehát arra is gyelni kell, hogy a következo síkhoz viszonyítva ugyanazon az oldalon van-e (15.26. ábra).
p [3]
p[2]
vágósík
p[4]
q[2] q [3] p[1] q[1]
p [5] q [4] p[0] q[0]
15.26. ábra. A ~ p[0], . . . , ~ p[5] sokszög vágása, amelynek eredménye a ~ q[0], . . . , ~ q[4] sokszög. Az eredménysokszög csúcsai és az éleknek a vágósíkkal képzett metszéspontjai. csúcsai az eredeti sokszög belso
sokszögünk csúcsai a p = h~ Tegyük fel, hogy az eredeti egyszeresen összefüggo p[0], . . . , ~p[n − 1]i tömbben érkeznek, a vágott sokszög csúcsait pedig a q = h~q[0], . . . , ~q[m − 1]i tömbbe kell elhelyezni. A vágott sokszög csúcsainak számát az m változóban tároljuk. A csúcs megvalósítás során kellemetlenséget okoz, hogy általában az i-edik csúcsot követo az (i
+
1)-edik, kivéve az utolsó, az (n
−
1)-edik csúcsot, amelyet a 0-adik követ. Ezt a
kellemetlenséget elháríthatjuk, ha a p tömböt kiegészítjük még egy ( ~ p[n]
= ~p[0]) elemmel,
amely még egyszer tárolja a 0-adik elemet. Ezek alapján a SutherlandHodgeman-poligonvágás: SH- ´ ´ (p)
←0 ← 0 to n − 1 pont do if ~ p[i] belso then ~ q[m] ← ~ p[i] B Az i-edik csúcs része a vágott poligonnak. m ← m+1 pont if ~ p[i + 1] külso then ~ q[m] ← M p[i], ~ p[i + 1]) ´ - ´ ´ ´( ~ m ← m+1 pont else if ~ p[i + 1] belso then ~ q[m] ← M p[i], ~ p[i + 1]) ´ - ´ ´ ´( ~ m ← m+1
1
m
2
for i
3 4 5 6 7 8 9 10 11 12
return q Alkalmazzuk gondolatban ezt az algoritmust olyan konkáv sokszögre, amelynek a vá-
gás következtében több részre kellene esnie (15.27. ábra). A sokszöget egyetlen tömbben részek elkülönítésére, és azokon a helyeken, nyilvántartó algoritmusunk képtelen a széteso
635
15.4. Tartalmazási algoritmusok
ahol valójában nem keletkezhet él, páros számú élt hoz létre.
páros számú határ
dupla határvonal részeket páros számú élek tartják össze. 15.27. ábra. Konkáv sokszögek vágásakor a széteso
A páros számú extra él azonban nem okoz problémát a továbbiakban, ha a sokszög pontjait a következo elv alapján határozzuk meg: a kérdéses pontból egy félegyenest belso indítunk a végtelen felé és megvizsgáljuk, hogy hányszor metszi a sokszög éleit. Páratlan pontjának tekintjük, páros számú metszámú metszéspont esetén a pontot a sokszög belso pontnak. szés esetén külso sokszögek vágására is alkalmazAz ismertetett algoritmus többszörösen összefüggo ható, csak ebben az esetben a bemutatott eljárást minden határoló zárt töröttvonalra különkülön kell végrehajtani. Szakaszok és poligonok vágása konvex poliéderre síMiként korábban megállapítottuk, egy konvex poliéder eloállítható a lapjaira illeszkedo kok által határolt félterek metszeteként (15.22. ábra bal oldala), így a konvex poliéderre vá vágásra. Egy féltérre vágás kimenete a következo gást visszavezethetjük félterekre történo eredményt pedig az utolsó féltéren féltérre vágás bemeneti vágandó alakzata lesz, a végso végrehajtott vágáson is átjutó alakzat jelenti. Szakaszok vágása AABB-re A képszintézis algoritmusokban különösen fontos szerepet kap egy speciális típusú konvex poliéder, az AABB. 15.11. deníció. A koordinátatengelyekkel párhuzamos oldalú téglatesteket AABB-nek nevezzük. Egy AABB-t a minimális és maximális Descartes-koordinátáival adunk meg: [xmin , ymin , zmin , xmax , ymax , zmax ]. Bár az AABB-re vágáshoz használható lenne az általános konvex poliéderre kidolgozott vágás, az AABB-k jelentosége miatt erre az esetre különlegesen gyors eljárást dolgoztak ki. Az AABB koordinátatengelyekkel párhuzamos oldalsíkjai a teret két részre bontják, részre, amelyikben maga az AABB található, és egy külso részre. A konvex poliegy belso éderre végrehajtott vágáshoz hasonlóan vessük össze a vizsgált pontot az AABB lapjaival, részben van, akpontosabban azok síkjaival. Ha a pontunk minden sík tekintetében a belso részben van, akkor a kor a pont az AABB-ben van, ha viszont valamely sík esetén a külso pont nem lehet az AABB belsejében. A szakasz AABB-re vágásához ezt az algoritmust mind a hat síkra végre kell hajtani, így elofordulhat, hogy kiszámítunk olyan metszéspontot is, amelyet egy másik vágósík fe-
636
15. Számítógépes graka
leslegessé tesz. Érdemes tehát a síkok sorrendjét ügyesen megválasztani. Az egyik legegyszerubb módszer a CohenSutherland szakaszvágó algoritmus. Jelöljük 1-gyel, ha a pont nem a vágási tartomány félterében helyezkedik el, míg 0-val, ha az AABB-vel azonos féltérben található. Mivel 6 határoló sík létezik, 6 darab 0 vagy 1 értékünk lesz, amelyeket egymás mellé téve egy 6-bites kódot kapunk (15.28. ábra). Egy pont C[0], . . . , C[5] kódbitjei:
( C[0]
=
1,
x
0
egyébként.
( C[3]
=
≤
xmin ,
1,
y
≥ ymax ,
0
egyébként.
( C[1]
=
x
0
egyébként.
( C[4]
=
≥
(
1,
xmax ,
C[2]
= (
1,
z
≤ zmin ,
0
egyébként.
C[5]
=
101000 1001
1000
1,
y
0
egyébként
≤ ymin ,
1,
z
0
egyébként
.
≥ zmax , .
101000
1010 100010 000000
0001
0000
0010 000000
0101
0100
0110 010100
15.28. ábra. A sík pontjainak 4-bites és a tér pontjainak 6-bites kódjai. A szakasz vágásnál a koordinátasíkok sorrendjét a szakasz végpontjainak kódjai választják ki.
pontok a vágási tartományban, a többiek Nyilvánvalóan a 000000 kóddal rendelkezo pedig azon kívül találhatók (15.28. ábra). Alkalmazzuk ezt a szakaszok vágására. Legyen 0, akkor mindkét végpont a szakasz két végpontjához tartozó kód C 1 és C 2 . Ha mindketto a vágási tartományon belül van, így a szakaszt nem kell vágni (triviális elfogadás). Ha a két kód ugyanazon a biten 1, akkor egyrészt egyik végpont sincs a vágási tartományban, szakasz is ebben másrészt ugyanabban a rossz féltérben találhatók, így az oket összeköto a féltérben helyezkedik el. Ez pedig azt jelenti, hogy nincs a szakasznak olyan része, amely belelógna a vágási tartományba, így az ilyen szakaszokat a további feldolgozásból ki lehet zárni (triviális eldobás). Ezt a vizsgálatot legegyszerubben úgy végezhetjük el, hogy a C 1 és C 2 kódokon végrehajtjuk a bitenkénti ÉS muveletet (a C programozási nyelv jelöléseit alkalmazva C 1 & C 2 ), és ha az eredményül kapott kód nem nulla, akkor az azt jelenti, hogy a két kód ugyanazon a biten 1. Végül, ha egyik eset sem áll fenn, akkor kell lennie olyan bitnek, ahol az egyik kód 0, a másik pedig 1 értéku. Ez azt jelenti, hogy van olyan vágósík, amelyre nézve az egyik a másik pedig a külso (rossz) tartományban van, így a szakaszt erre a végpont a belso, síkra vágni kell. A vágás után a metszéspont kódbitjeit kiértékeljük és a rossz oldalon lévo kezdve addig isvégpontot a metszéspontra cseréljük. Az eljárást a feltételek ellenorzését ol döntést mételjük, amíg triviális elfogadással vagy triviális eldobással nem tudunk végso
15.5. Mozgatás, torzítás, geometriai transzformációk
637
hozni. A CohenSutherland szakaszvágó algoritmus a vágott szakasz végpontjait a paraméterként kapott végpontok módosításával adja meg, és visszatérési értéke akkor igaz, ha a vágás után a szakasz legalább részben a vágási tartomány belsejében van: CS-- r1 ,~ r2 ) ´ ´ (~ ← az ~r1 végpont kódja B Kódbitek az egyenlotlenségek ellenorzésével. ← az ~r2 végpont kódja while do if C 1 = 0 és C 2 = 0 then return B Triviális elfogadás: van belso szakasz. if C 1 & C 2 , 0 then return B Triviális eldobás: nincs belso szakasz. f ← a legelso bit indexe, amelyen a C 1 és a C 2 különbözik ~ri ← az (~r1 , ~r2 ) szakasz és az f indexu sík metszéspontja C i ← az ~ ri metszéspont kódja if C 1 [ f ] = 1 then ~ r1 ← ~ ri C1 ← Ci B ~r1 van az f -edik sík rossz oldalán. else ~ r2 ← ~ ri C2 ← Ci B ~r2 van az f -edik sík rossz oldalán.
1
C1
2
C2
3 4 5 6 7 8 9 10 11 12 13 14 15
Gyakorlatok 15.4-1. Tegyünk javaslatokat a poliéder-poliéder ütközésfelismerés négyzetes idobonyolultságának csökkentésére. 15.4-2. Készítsünk CSG-fa adatszerkezethez pont tartalmazást vizsgáló algoritmust. 15.4-3. Készítsünk algoritmust, amely egy sokszöget egy másik, akár konkáv sokszögre vág. 15.4-4. Készítsünk algoritmust, amely egy poliéder befoglaló gömbjét, illetve befoglaló AABB-jét kiszámítja. 15.4-5. Adjunk algoritmust a síkban két háromszög ütközésének felismeréséhez. 15.4-6. Általánosítsuk a CohenSutherland szakaszvágó módszert konvex poliéder vágási tartományra. 15.4-7. Dolgozzuk ki a szakaszt gömbre vágó módszert.
15.5. Mozgatás, torzítás, geometriai transzformációk mozoghatnak, torzulhatnak, nohetnek, A virtuális világ szereploi illetve összemehetnek, azaz az eddig ismertetett egyenleteket elvileg minden idopillanatban újra fel kell venni. függvény az eloz o alfejezet A gyakorlatban ehelyett két függvénnyel dolgozunk. Az elso módszerei szerint kiválasztja a tér azon pontjait, amelyek az adott objektumhoz tartoznak annak egy referenciahelyzetében. A második függvény pedig a referenciahelyzetben az ob jektumhoz tartozó pontokat leképezi az aktuális idopillanathoz tartozó pontokra. A teret
638
15. Számítógépes graka
függvény a transzformáció. A mozgatást invertálható önmagára leképezo mációval írhatjuk le. Az ~ r kiindulási pont neve tárgypont, az ~ r Az invertálhatóság miatt minden transzformált ~ r alakzatbeli osképét a
T
−1
0
0
= T (~r)
T (~r)
transzfor-
pedig a képpont.
ponthoz megkereshetjük annak eredeti
0
(~ r ) inverz transzformáció segítségével.
Ha az alakzatot a referenciahelyzetében az f implicit függvény deniálja, akkor a transzformált alakzat pontjainak halmaza
{~r 0
: f (T
−1
0
(~ r ))
≥ 0} ,
(15.12)
hiszen a transzformált alakzat pontjainak osképei az eredeti alakzatban vannak. A paraméteres egyenletek közvetlenül az alakzat pontjainak Descartes-koordinátáit adják meg, így a ponthalmaz transzformációjához a paraméteres alakot kell transzformálni. Egy ~ r
= ~r(u, v) egyenletu felület transzformáltjának egyenlete tehát ~r 0 (u, v) = T (~r(u, v)) .
Hasonlóan egy ~ r
= ~r(t) egyenletu görbe transzformáltjának egyenlete: ~r 0 (t) = T (~r(t)) .
A
T
(15.13)
(15.14)
transzformáció általános esetben megváltoztathatja az alakzat és egyenletének a
vagy egy gömbbol bonyolult, torz jellegét. Könnyen elofordulhat, hogy egy háromszögbol alakzat keletkezik, ami csak ritkán kívánatos. Ezért a transzformációk körét érdemes szu kíteni. Nagy jelentosége van például az olyan transzformációknak, amelyek síkot síkba, egyenest egyenesbe visznek át. Ehhez a csoporthoz tartoznak a homogén lineáris transz fejezetben foglalkozunk. formációk, amelyekkel a következo
15.5.1. Projektív geometria és homogén koordináták Idáig a virtuális világ felépítését az euklideszi geometria alapján tárgyaltuk, amely olyan fontos fogalmakat adott a kezünkbe, mint a távolság, a párhuzamosság, a szög stb. A transz bizonyos formációk mélyebb tárgyalása során azonban ezek a fogalmak érdektelenek, sot esetekben zavart is kelthetnek. A párhuzamosság például az egyenesek egy speciális viszonyát jelenti, amelyet külön kell kezelni akkor, ha egyenesek metszéspontjáról beszélünk. Ezért a transzformációk tárgyalásához az euklideszi geometria helyett egy erre alkalmasabb eszközt, a projektív geometriát hívjuk segítségül. A projektív geometria axiómái ügyesen kikerülik az euklideszi geometria párhuzamo sainak a problémáját azzal, hogy teljesen mellozik ezt a fogalmat, és kijelentik, hogy két egyenesnek mindig van metszéspontja. Ennek érdekében a projektív geometriákülönbözo ban minden egyeneshez hozzáveszünk egy végtelen távoli pontot, mégpedig úgy, hogy két egyeneshez akkor és csak akkor tartozzon ugyanaz a pont, ha a két egyenes párhuzamos. Az új pontot ideális pontnak nevezzük. A projektív tér az euklideszi tér pontjait (az úgynevezett közönséges pontokat) és az ideális pontokat tartalmazza. Az ideális pont az euklideszi egyenes
összeragasztja végeit, ezért topológiailag az egyenes a körhöz lesz hasonlatos. To-
vábbra is érvényben szeretnénk tartani az euklideszi geometria azon axiómáját, hogy két
pont egy egyenest határoz meg. Annak érdekében, hogy ez két ideális pontra is igaz legyen, az euklideszi sík egyeneseinek halmazát bovítjük az ideális pontokat tartalmazó, úgynevezett ideális egyenessel. Mivel két egyenes ideális pontja csak akkor egyezik meg, ha a
639
15.5. Mozgatás, torzítás, geometriai transzformációk
két egyenes párhuzamos, két sík ideális egyenese akkor és csak akkor azonos, ha a két sík párhuzamos. Az ideális egyenesek az ideális síkra illeszkednek, amelyet ugyancsak hozzáveszünk a tér síkjainak halmazához. Ezen döntések után nem kell különbséget tennünk az a projektív tér ugyanolyan tagjai. euklideszi tér pontjai és az ideális pontok között, ok Az analitikus geometria bevezetésénél említettük, hogy a számítógépes grakában mindent számokkal kell leírni. Az idáig használt Descartes-koordináták egy-egy értelmu kapcsolatban állnak az euklideszi tér pontjaival, így az ideális pontok jellemzésére alkalmatlanok. Az euklideszi geometria pontjait és az ideális pontokat egyaránt tartalmazó projektív sík és projektív tér jellemzésére tehát más algebrai alapra van szükségünk. Projektív sík Eloször tekintsük a projektív síkot, amelynek pontjait szeretnénk számszerusíteni, és vegyünk fel egy x, y koordinátarendszert ezen a síkon. Válasszunk az euklideszi térben egy Xh , Yh , h Descartes-koordinátarendszert úgy, hogy az Xh , Yh tengelyek az x, y tengelyekkel párhuzamosak legyenek, a sík koordinátarendszerének origója a tér (0, 0, 1) pontjában legyen, és a síkunk pontjaira a h
= 1 egyenlet teljesüljön. A vizsgált projektív síkot tehát beá-
gyaztuk egy háromdimenziós euklideszi térbe, amelynek pontjait Descartes-koordinátákkal azonosításához pedig adjuk meg (15.29. ábra). A projektív sík pontjainak számokkal történo kapcsolatot teremtünk a beágyazó euklideszi tér pontjai és a projektív sík pontjai között. Ez a kapcsolat a projektív sík egy közönséges, vagy akár ideális P pontját a beágyazó euklide pontoknak felelteti meg, amelyet a beágyazó koordinátarendszer szi tér azon egyenesén lévo origója és a P pont meghatároz. egyenes pontjait a [t Az origón átmeno
· Xh , t · Yh , t · h] paraméteres formában adhatjuk
meg a t paraméter függvényében. Amennyiben a P pont a sík közönséges pontja, az egyenes nem párhuzamos a h
=
1 síkkal (azaz h
,
0). Az egyenes az [Xh /h, Yh /h, 1] pontban
metszi a síkot, így a P pontnak a síkhoz rendelt Descartes-koordinátarendszerbeli koordinátái (Xh /h, Yh /h). Ha viszont a P pont ideális, az egyenes párhuzamos a h h
= 1 síkkal (azaz = 0). Az ideális pontok irányát ebben az esetben az (Xh , Yh ) vektor jelöli ki. [x.h, y .h, h] egyenes
h
[Xh ,Yh ,h] pont [x, y, 1] h=1 Xh Yh
[Xh ,Yh ,0] pont
15.29. ábra. A projektív sík beágyazott modellje: a projektív síkot a háromdimenziós euklideszi térbe ágyazzuk, és a projektív sík egy pontjának az euklideszi tér azon egyenesét feleltetjük meg, amelyet az origó és az adott pont meghatároz.
Ezzel az eljárással tehát a síknak mind a közönséges, mind pedig az ideális pontjaihoz [Xh , Yh , h] számhármasokat rendeltünk, amelyeket a síkbeli pont homogén koordinátáinak nevezünk. A homogén koordinátákat szögletes zárójelek közé tesszük, hogy a Descarteskoordinátáktól megkülönböztessük. A homogén koordináták bevezetésénél a projektív sík egy pontjának az euklideszi tér-
640
15. Számítógépes graka
egyenesét feleltettünk meg, amelyet bármely, az origótól különbözo nek az origón átmeno következik, hogy mindhárom homogén koordináta nem lehet pontjával megadhatunk. Ebbol egyszerre zérus, és hogy a homogén koordináták egy nem zérus skalárral szabadon szoroz még a projektív sík ugyanazon pontját azonosítják. Ez a tulajdonság indokolja hatók, ettol a
homogén elnevezést. A közönséges pontokat azonosító homogén koordinátahármasok közül gyakran cél-
két hoszeru azt kiválasztani, ahol a harmadik koordináta 1 értéku, ugyanis ekkor az elso mogén koordináta a Descartes-koordinátákkal egyezik meg: Xh
= x,
Yh
= y,
h
=1.
(15.15)
Descartes-koordinátákat tehát úgy alakíthatunk homogén koordinátákká, hogy hozzájuk csapunk egy harmadik, 1 értéku elemet. A beágyazott modell alapján könnyen felírhatjuk a projektív sík egyeneseinek és sza kaszainak homogén koordinátás egyenletét is. Vegyünk fel a projektív síkon két, különbözo pontot, és adjuk meg oket a homogén koordinátáikkal. A különbözoség azt jelenti, hogy
, Yh1 , h1 ] hármasból egy skalárral való szorzással nem állítható elo az [Xh2 , Yh2 , h2 ] hár így mas. A síkot beágyazó térben az [Xh , Yh , h] hármas Descartes-koordinátának tekintheto, 1 1 1 2 2 2 egyenes egyenlete: az [X , Y , h ] és [X , Y , h ] pontokat összeköto h h h h az [X
1 h
Xh (t) Yh (t) h(t) Ha h(t)
,
= = =
1
· (1 − t) + Xh2 · t , 1 2 Yh · (1 − t) + Yh · t , 1 2 h · (1 − t) + h · t . Xh
(15.16)
közönséges pontokat úgy kapjuk meg, hogy a há0, akkor projektív síkon lévo
romdimenziós tér pontjait a h
= 1 síkra vetítjük. A vetítés egyenest egyenesbe visz át, hiszen
pontok megkövetelésével kizártuk azt az esetet, amikor a vetítés az egyenest a különbözo egyetlen pontra képezné le. Tehát az egyenlet valóban egy egyenes pontjait azonosítja. Ha viszont h(t)
= 0, akkor az egyenlet az egyenes ideális pontját fejezi ki.
Ha t tetszoleges értéket felvehet, akkor az egyenes pontjait kapjuk. Ha viszont t értékét a [0, 1] intervallumra korlátozzuk, a két pont által kijelölt szakasz egyenletéhez jutunk. Projektív tér A projektív tér homogén koordinátáinak bevezetéséhez ugyanazt az utat követhetnénk, mint amit a síknál használtunk, de ehhez a háromdimenziós projektív teret a négydimenziós euklideszi térbe kellene beágyazni, ami kevésbé szemléletes. Ezért egy másik konstrukciót is tárgyalunk, amely tetszoleges dimenzióban muködik. A pontjainkat mechanikai rendszerek súlypontjaiként írjuk le. Egyetlen pont azonosításához egy ~ p1 referencia pontban Xh súlyt helyezünk el, egy ~ p2 referencia pontban Yh súlyt, egy ~ p3 pontban Zh súlyt és végül egy ~ p4 pontban w súlyt. A mechanikai rendszer súlypontja:
~r =
Xh
· ~p1 + Yh · ~p2 + Zh · ~p3 + w · ~p4 . Xh + Yh + Zh + w
Vezessük be az összsúly fogalmát a h
=
Xh
+ Yh + Zh + w egyenlettel. Deníciószeruen az
[Xh , Yh , Zh , h] négyest a súlypont homogén koordinátáinak nevezzük. A homogén és a Descartes-koordináták közötti összefüggés felállításához a két koordinátarendszer viszonyát (a Descartes-koordinátarendszer bázisvektorainak, origójának és
641
15.5. Mozgatás, torzítás, geometriai transzformációk
a homogén koordinátarendszer referencia pontjainak kapcsolatát) rögzíteni kell. Tegyük fel például, hogy a referencia pontok a Descartes-koordinátarendszer (1,0,0), (0,1,0), (0,0,1) és (0,0,0) pontjaiban vannak. A mechanikai rendszerünk súlypontja (ha a h összsúly nem zérus) a Descartes-koordinátarendszerben:
~r[Xh , Yh , Zh , h] =
1 h
· (Xh · (1, 0, 0) + Yh · (0, 1, 0) + Zh · (0, 0, 1) + w · (0, 0, 0)) =
X
h
h
,
Yh h
,
Zh h
.
Tehát az [Xh , Yh , Zh , h] homogén koordináták és az (x, y, z) Descartes-koordináták közötti összefüggés (h
, 0): =
x
Xh h
,
y
=
Yh h
,
z
=
Zh h
.
(15.17)
A projektív tér egyeneseinek és szakaszainak homogén koordinátás egyenletét akár a négydimenziós térbe ágyazott projektív tér modell felhasználásával, akár a súlypont analógia alapján is megkaphatjuk: Xh (t) Yh (t) Zh (t) h(t)
= = = =
1
· (1 − t) + Xh2 · t , 1 2 Yh · (1 − t) + Yh · t , 1 2 Zh · (1 − t) + Zh · t , 1 2 h · (1 − t) + h · t . Xh
(15.18)
Ha t értékét a [0, 1] intervallumra korlátozzuk, a két pont által kijelölt projektív szakasz egyenletéhez jutunk. A projektív sík egyenletének felírásához induljunk ki az euklideszi tér síkjának (15.1) A sík pontjainak Descartes-koordinátái kielégítik az egyenletébol. nx
· x + ny · y + nz · z + d = 0
Descartes és homogén koordináták köimplicit egyenletet. A (15.17) egyenletben szereplo zötti összefüggést behelyettesítve az egyenletbe továbbra is az euklideszi sík pontjait írjuk le: nx
·
Xh h
+ ny ·
Yh h
+ nz ·
Zh h
+d =0 .
Szorozzuk meg az egyenlet mindkét oldalát h-val, majd a h
= 0 koordinátájú, az egyenletet
pontokat is adjuk síkhoz. Ezzel az euklideszi sík pontjait kiegészítettük az ideális kielégíto pontokkal, azaz a projektív síkhoz jutottunk. A projektív sík egyenlete tehát egy homogén lineáris egyenlet: nx vagy mátrixos alakban:
· Xh + ny · Yh + nz · Zh + d · h = 0 , [Xh , Yh , Zh , h] ·
nx ny nz d
= 0 .
(15.19)
(15.20)
Figyeljük meg, hogy a tér pontjait négyelemu sorvektorokkal, a síkjait pedig négyelemu oszlopvektorokkal írhatjuk le. Mind a pontok négyesei, mind pedig a síkok négyesei homogén tulajdonságúak, azaz skalárral szabadon szorozhatók anélkül, hogy a homogén lineáris egyenlet megoldásai változnának.
642
15. Számítógépes graka
15.5.2. Homogén lineáris transzformációk Azokat a leképzéseket, ahol a képpont homogén koordinátáit a tárgypont homogén koordinátáinak és egy állandó 4
× 4-es
T transzformációs mátrixnak a szorzataként írhatjuk fel,
homogén lineáris transzformációknak nevezzük:
0
0
0
0
[Xh , Yh , Zh , h ]
= [Xh , Yh , Zh , h] · T .
(15.21)
15.12. tétel. A homogén lineáris transzformációk pontot pontba visznek át.
λ · [Xh , Yh , Zh , h] a négyesekbol a λ tetszoleges, nem zérus konstans. Ezekbol 0 0 0 0 transzformáció λ · [X , Y , Z , h ] = λ · [Xh , Yh , Zh , h] · T alakú négyeseket hoz létre, amelyek h h h ugyanazon négyes λ-szorosai, így az eredmény egyetlen pont homogén koordinátáit adja.
Bizonyítás. A transzformáció egy tárgypontját homogén koordinátákban alakban adhatjuk meg, ahol
Figyeljük meg, hogy a homogén tulajdonság miatt a homogén lineáris transzformációk csak egy skalárral való szorzás erejéig meghatározottak, azaz a transzformáció nem változik, ha a T mátrix minden elemét ugyanazzal a nem zérus skalárral szorozzuk. 15.13. tétel. Az invertálható homogén lineáris transzformációk egyenest egyenesbe visznek át. Bizonyítás. Induljunk ki a tárgyegyenes paraméteres egyenletébol: [Xh (t), Yh (t), Zh (t), h(t)]
= [Xh1 , Yh1 , Zh1 , h1 ] · (1 − t) + [Xh2 , Yh2 , Zh2 , h2 ] · t,
t
= (−∞, ∞) ,
a képalakzatot a tárgyalakzat pontjainak egyenkénti transzformálásával: és állítsuk elo
0
0
0
0
[Xh (t), Yh (t), Zh (t), h (t)]
= [Xh (t), Yh (t), Zh (t), h(t)] · T
= [Xh1 , Yh1 , Zh1 , h1 ] · T · (1 − t) + [Xh2 , Yh2 , Zh2 , h2 ] · T · t 0
0
] az [X
1 h
0
0
0
0
0
0
= [Xh1 , Yh1 , Zh1 , h1 ] · (1 − t) + [Xh2 , Yh2 , Zh2 , h2 ] · t , ahol [X
10 h
0
0
, Yh1 , Zh1 , h1
0
, Yh1 , Zh1 , h1 ]
pont, [X
20 h
0
0
, Yh2 , Zh2 , h2
0
] pedig az [X
2 h
, Yh2 , Zh2 , h2 ]
A pont transzformáltja. A transzformáció invertálhatósága miatt a két pont különbözo. transzformált alakzat egyenlete éppen egy egyenes egyenlete, amely a két transzformált pontra illeszkedik.
Megjegyezzük, hogy ha nem kötöttük volna ki a transzformáció invertálhatóságát, ak kor elofordulhatott volna, hogy a két tartópont képe ugyanaz a pont lenne, így az egyenesbol a transzformáció következtében egyetlen pont keletkezik. Ha a t paramétert a [0, 1] tartományra korlátozzuk, akkor a projektív szakasz egyenletét kapjuk, így kimondhatjuk, hogy a homogén lineáris transzformáció projektív szakaszt általánosan is igaz, hogy a homogén lineáris transzformáprojektív szakaszba visz át. Sot ciók konvex-kombinációkat konvex-kombinációkba visznek át, így például háromszögbol háromszög keletkezik. Ezzel a tétellel azonban nagyon óvatosan kell bánnunk akkor, ha az euklideszi geomet beszélünk. Vegyünk egy szakaszt. Ha a két végpont h ria szakaszairól és háromszögeirol
643
15.5. Mozgatás, torzítás, geometriai transzformációk
elojel projektív szakasz tartalmazza az ideális koordinátája eltéro u, a pontokat összeköto és a félegyenesek végét összekappontot is. Az ilyen szakasz intuitíve két félegyenesbol csoló ideális pontból áll, azaz a szokásos euklideszi szakasz fogalmunk kifordult változata. Elofordulhat, hogy a transzformáció tárgyszakaszában a végpontok azonos elojel u h koordinátákkal rendelkeznek, azaz a projektív szakasz megfelel az euklideszi geometria szakaszfogalmának, a transzformáció képszakaszának végpontjaiban viszont a h koordináták már elojel eltéro uek lesznek. Így szemléletesen a transzformáció kifordítja a szakaszunkat. 15.14. tétel. Az invertálható homogén lineáris transzformációk síkot síkba visznek át. Bizonyítás. Az [Xh , Yh , Zh , h]
= [Xh0 , Yh0 , Zh0 , h0 ] · T−1 pontok azaz az [Xh0 , Yh0 , Zh0 , h0 ] transz-
formált pontok osképei egy síkon vannak, ezért kielégítik az eredeti sík egyenletét:
[Xh , Yh , Zh , h] ·
nx ny nz d
0 0 0 0 − 1 = [X , Y , Z , h ] · T · h h h
nx ny nz d
= 0 .
A mátrixszorzás asszociativitása miatt a transzformált pontok kielégítik az
0 0 0 0 [Xh , Yh , Zh , h ] ·
0
nx
0
ny
0
nz d
0
= 0
egyenletet, amely ugyancsak egy sík egyenlete, ahol
0
nx
0
ny
0
nz d
0
= T−1 ·
nx ny nz d
.
Ezt az összefüggést felhasználhatjuk a transzformált sík normálvektorának számításához. A homogén lineáris transzformációk fontos speciális esetei az affin transzformációk, amelyekben a képpont Descartes-koordinátái a tárgypont Descartes-koordinátáinak lineáris függvényei: [x
0
, y0 , z0 ] = [x, y, z] · A + [ p x , py , pz ] ,
ahol a különálló ~ p vektor az eltolásért felelos, az A pedig egy 3
(15.22)
×
3-as mátrix, amely a
ezek tetszoleges forgatást, a skálázást, a tükrözést stb., sot kombinációját is kifejezheti. Pél (t x , ty , tz ), (|(t x , ty , tz )| dául az origón átmeno
=
1) irányú tengely körül
φ
szöggel forgató
transzformációban
A =
− t2x ) cos φ + t2x ty t x (1 − cos φ) − tz sin φ tz t x (1 − cos φ) + ty sin φ (1
− cos φ) + tz sin φ 2 2 (1 − ty ) cos φ + ty tz ty (1 − cos φ) − t x sin φ t x ty (1
Ez az összefüggés Rodrigues-képlet néven ismeretes.
− cos φ) − ty sin φ t x tz (1 − cos φ) + t x sin φ 2 2 (1 − tz ) cos φ + tz t x tz (1
.
644
15. Számítógépes graka
és párhuzamos egyeneAz affin transzformációk nem vezetnek ki az euklideszi térbol, seket párhuzamos egyenesekbe visznek át. Az affin transzformációk egyben homogén lineáris transzformációk, hiszen a (15.22) egyenlet egy 4
× 4-es
mátrixmuvelettel is leírható,
miután a Descartes-koordinátákról áttérünk homogén koordinátákra a negyedik homogén koordinátát 1-nek választva:
0 0 0 [x , y , z , 1] = [x, y, z, 1] ·
A11
A12
A13
0
A21
A22
A23
0
A31
A32
A33
0
px
py
pz
1
= [x, y, z, 1] · T .
(15.23)
Az affin transzformációk körén belül további speciális eset a távolságtartó transzformáció, amelyet egybevágósági transzformációnak nevezünk. Az egybevágósági transzformációk egyben szögtartóak is. 15.15. tétel. Az egybevágósági transzformációkban az A mátrix sorai egységvektorok és egymásra merolegesek. Bizonyítás. Induljunk ki az egybevágósági transzformációk szög- és távolságtartó tulajdonságából, és alkalmazzuk ezt arra az esetre, amikor éppen az origót és a bázisvekto az rokat transzformáljuk. Az origóból a transzformáció a ( p x , py , pz ) pontot állítja elo, (1, 0, 0), (0, 1, 0) és (0, 0, 1) pontokból pedig rendre az (A11
+
p x , A12
+
py , A13
+
pz ),
(A21 + p x , A22 + py , A23 + pz ) és (A31 + p x , A32 + py , A33 + pz ) pontokat. A távolságtartás miatt transzformált pontok és az új origó távolsága továbbra is egységnyi, azaz | A11 , A12 , A13 | = 1, |A21 , A22 , A23 | = 1 és |A31 , A32 , A33 | = 1. Másrészt, a szögtartás miatt a bázisvektorok transz formáltjai, az (A11 , A12 , A13 ), (A21 , A22 , A23 ) és (A31 , A32 , A33 ) vektorok egymásra merolegesek.
Gyakorlatok 15.5-1. A Descartes-koordinátarendszer, mint algebrai alap felhasználásával igazoljuk az euklideszi geometria axiómáit, például, hogy két pontra egy egyenes illeszkedik, és hogy egyenes legfeljebb egyetlen pontban metszi egymást. két különbözo 15.5-2. A homogén koordináták, mint algebrai alap felhasználásával igazoljuk a projektív egyenes mindig egy pontban metszi egygeometria egy axiómáját, miszerint két különbözo mást. 15.5-3. Bizonyítsuk be a súlypont analógia alapján, hogy a homogén lineáris transzformációk egy háromdimenziós szakaszt szakaszba visznek át. 15.5-4. Hogyan változtatja meg egy affin transzformáció egy test térfogatát? 15.5-5. Írjuk fel a ~ p vektorral eltoló transzformáció mátrixát. 15.5-6. Igazoljuk a Rodrigues-képletet. 15.5-7. Egy f (~ r)
≥
0 egyenlotlenséggel leírt test ~ v sebességgel egyenletesen mozog. Írjuk
fel a test pontjait leíró egyenlotlenséget a t idopillanatban. 15.5-8. Igazoljuk, hogy ha az A mátrix sorai egymásra meroleges egységvektorok, akkor az affin transzformáció egyben egybevágósági transzformáció is. Mutassuk meg, hogy ilyen
−1
mátrixokra A
= AT .
15.5-9. Írjuk fel azon homogén lineáris transzformáció mátrixát, amely a teret ~ c középponttal az ~ n normálvektorú, ~ r0 helyvektorú síkra vetíti.
645
15.6. Megjelenítés sugárkövetéssel
15.30. ábra. Képszintézis sugárkövetéssel.
15.5-10. Mutassuk meg, hogy 5 tárgypont-képpont pár egyértelmuen azonosít egy homogén lineáris transzformációt, ha az 5 pont közül semelyik négy sincs egy síkon.
15.6. Megjelenítés sugárkövetéssel A virtuális világ lefényképezéséhez azt kell meghatároznunk, hogy a virtuális meggyelo irányokban milyen felületi pontokat lát. A lehetséges irányokat egy téglalap a különbözo pixeleinek megfeleloen alakú ablakkal jelölhetjük ki, amelyet a képernyo egy négyzetrácsra képviseli a virtuális világban (19.12. ábra). Mivel a képbontunk fel. Az ablak a képernyot pixeleit csak egyetlen színnel lehet kitölteni, elegendo a négyzetrács négyzeteinek ernyo pontokban) vizsgálnunk egy-egy pontjában (célszeruen a pixel középpontoknak megfelelo a látható felületet. A szempozícióból egy irányban az a felület látható, amelyet a szempozícióból az adott irányban induló félegyenes a sugár a szempozícióhoz a legközelebb metsz. A sugár és a felületek legközelebbi metszéspontjának kiszámítását sugárkövetésnek nevezzük. A sugárkövetés nem csak a láthatóság eldöntésénél kap szerepet. Ha árnyékot kívánunk számítani, azaz arra vagyunk kíváncsiak, hogy a felületek egy pontot mely fényforrások takarnak el, akkor a pontból a fényforrások irányába ugyancsak sugarakat küldünk és elol elérnék a fényforeldöntjük, hogy ezek a sugarak metszenek-e valamilyen felületet mielott rásokat. A sugárkövetés szerepet kap a virtuális világ objektumai közötti ütközések felis pont azzal a felülettel merésénél is, ugyanis egy egyenes vonalú egyenletes mozgást végzo ütközik, amelyet a pont pályáját leíró sugár eloször metsz. egyenlettel adjuk meg: A sugarat a következo
~ ray(t)
= ~s + ~v · t,
(t
> 0) ,
(15.24)
ahol ~ s a kezdopont helyvektora, ~ v a sugár iránya, a t sugárparaméter pedig a kezdoponttól való távolságot jellemzi. A továbbiakban azzal a feltételezéssel élünk, hogy ~ v egységvektor,
646
15. Számítógépes graka
4
mert ekkor t a tényleges távolságot jelenti, egyébként csak arányos volna a távolsággal . Ha t negatív, akkor a pont a szem mögött helyezkedik el, így nem jelent metszéspontot a félegyenessel (nem látható). A legközelebbi metszéspont megkeresése a legkisebb, pozitív sugárparaméteru metszéspont eloállítását jelenti. A legközelebbi metszéspont eloállításához elvileg minden felülettel meg kell kísérelni a sugár és a felület metszéspontjának eloállítását, metszéspontok közül a legközelebbit kell kiválasztani. Egy sugár és a ténylegesen létezo algoritmus alkalmazható: legközelebbi metszéspontjának számításához a következo S s, ~ v) ´ - - ´ (~
← tmax
B Inicializálás a tér legnagyobb méretére.
1
t
2
for minden o objektumra
3
if 0
5 6 7
←S - s, ~ v) B Negatív, ha nincs metszéspont. ´ - ¨ ´ (~ ≤ to < t B Az új metszéspont közelebbi-e? then t ← to B A legközelebbi metszés sugárparamétere. ometszett ← o B A legközelebb metszett objektum. t < tmax then B Volt egyáltalán metszéspont? then ~ x ← ~ s +~ v·t B A metszéspont helye a sugár egyenletébol. return t, ~ x, ometszett else return nincs metszéspont B Nincs metszéspont. do to
4
if
8 9 10
Az algoritmus a sugarat kapja bemeneti paraméteréül, és az ~ x változóban a metszéspont helyét, az ometszett változóban pedig a metszett objektumot adja meg. A harmadik visszaadott érték a metszésponthoz tartozó sugárparaméter. Az algoritmus az objektumonkénti S ´ -
- ¨ ´ eljárást használja fel, amely az adott objektum és a sugár metszéspontjához tartozó sugárparamétert számítja ki, illetve negatív értékkel jelzi, ha a metszéspont nem létezne. A S - ´ - ¨ ´ algoritmust objektumtípusonként külön-külön kell megvalósítani.
15.6.1. Sugár-felület metszéspont számítás A sugár-felület metszéspont megkeresése lényegében egy egyenlet megoldását jelenti. A metszéspont a sugár és a vizsgált felület közös része, amit megkaphatunk, ha a sugár egyen egyenletet megoldjuk az ismeretletét behelyettesítjük a felület egyenletébe, és a keletkezo len sugárparaméterre. Implicit egyenletu felületek metszése Az f (~ r)
= 0 implicit egyenletu felületeknél az
f (~ s +~ v
· t) = 0 skalár egyenletet kell megol-
dani. Tekintsük példaként a gömböt, ellipszist, hengert, kúpot, paraboloidot stb. magában foglaló másodrendu felületek családját, amelyek implicit egyenlete egy kvadratikus alakkal
4
Az ütközésfelismerésnél ezzel szemben a ~ v nem egységvektor, hanem a mozgó pont sebességvektora, mert ekkor
a t sugárparaméter az ütközés idejét fejezi ki.
647
15.6. Megjelenítés sugárkövetéssel
adható meg:
ahol Q egy 4
[x, y, z, 1] · Q ·
x y z 1
= 0 ,
× 4-es mátrix. A sugár egyenletét a felület egyenletébe helyettesítve, az s x + v x · t sy + vy · t =0, [s x + v x · t, sy + vy · t, sz + vz · t, 1] · Q · sz + vz · t 1
egyenletet kapjuk, amit átrendezve egy másodfokú egyenlethez jutunk: t ahol v
2
· (v · Q · vT ) + t · (s · Q · vT + v · Q · sT ) + (s · Q · sT ) = 0 ,
= [v x , vy , vz , 0] és s = [s x , sy , sz , 1].
A másodfokú egyenlet megoldóképletével a gyököket megkaphatjuk, amelyek közül most csak a pozitív, valós gyökök értelmesek. Ha két ilyen gyök is volna, akkor a kisebb felel meg a legközelebbi metszéspontnak. Paraméteres felületek metszése Az ~ r
= ~r(u, v)
paraméteres felület és a sugár metszéspontját úgy kereshetjük meg, hogy
eloször az ismeretlen u, v, t paraméterekre megoldjuk az
~r(u, v) = ~s + t · ~v háromváltozós, nemlineáris egyenletrendszert, majd ellenorizzük, hogy a kapott t pozitív-e, és az u, v paraméterek valóban a megengedett paramétertartomány belsejében vannak-e. A nemlineáris egyenletrendszer gyökeit általában numerikus módszerekkel állíthatjuk vagy a felületeket háromszöghálóval közelítjük, majd ezt próbáljuk meg a sugárral elo, elmetszeni. Ha sikerül metszéspontot találni, az eredményt úgy lehet pontosítani, hogy a paramétertartományban egy nomabb tesszellációt metszéspont környezetének megfelelo készítünk, és a metszéspontszámítást újra elvégezzük. Háromszög metszése
A háromszögek metszéséhez eloször eloállítjuk a sugár és az ~ a, ~ b és ~ c csúcsú háromszög síkjának metszéspontját, majd eldöntjük, hogy a metszéspont a háromszögön belül van-e. A háromszög síkjának normálvektora ~ n
= (~b − ~a) × (~c − ~a), egy helyvektora pedig ~a, tehát a
egyenletet: sík ~ r pontjai kielégítik a következo
~n · (~r − ~a) = 0 .
(15.25)
A sugár és a sík közös pontját megkaphatjuk, ha a sugár egyenletét ((15.24) egyenlet) egyenletet megoldbehelyettesítjük a sík egyenletébe ((15.25) egyenlet), majd a keletkezo juk az ismeretlen t paraméterre. Ha a kapott t
∗
érték pozitív, akkor visszahelyettesítjük a
sugár egyenletébe, ha viszont negatív, akkor a metszéspont a sugár kezdopontja mögött he lyezkedik el, így nem érvényes. A sík metszése után azt kell ellenoriznünk, hogy a kapott ~ p pont vajon a háromszögön kívül vagy belül helyezkedik-e el. A tartalmazás eldöntéséhez a 15.4.1. pont algoritmusát használhatjuk fel.
648
15. Számítógépes graka
AABB metszése Egy AABB egy koordinátasíkokkal párhuzamos oldalú téglatest, amelynek felületét 6 tég o pont algoritmusaira lalapra, illetve 12 háromszögre bonthatjuk fel, így a metszését az eloz vezethetjük vissza. Az általános sík-sugár metszés helyett azonban lényegesen hatékonyabb megoldáshoz juthatunk, ha felismerjük, hogy ebben a speciális esetben a számítások a há el. Egy AABB ugyanis az xmin rom koordinátára külön-külön végezhetok lotlenséggel deniált x-réteg, az ymin zmin
≤ z ≤ zmax
≤
y
≤
≤
x
≤
xmax egyen-
ymax egyenlotlenséggel deniált y-réteg, és a
egyenlotlenséggel deniált z-réteg metszete. Tekintsük például az x-réteget,
amellyel a metszés sugárparaméterei: 1
tx
=
xmin
− sx
vx
,
2
tx
=
xmax
− sx
vx
.
belépést, a másik pedig a kilépést azonoA két paraméter közül a kisebbik a rétegbe történo sítja. Jelöljük a belépés sugárparaméterét t
be
ki
-vel, a kilépését t -vel. A sugár tehát a [t
be
, tki ]
tartományban tartózkodik az x-réteg belsejében. Ugyanezt a számítást az y és z-rétegre is elvégezve három intervallumot kapunk. A sugár az intervallumok metszetében lesz az AABB belsejében. Ha a metszet t
ki
paramétere negatív, akkor az AABB a szempozíció mögött van,
így nincs metszéspont. Ha csak a t széspont pedig a t
ki
be
indul, a metnegatív, akkor a sugár a doboz belsejébol
értéknél következik be. Végül ha t
hatol a dobozba, mégpedig a t
be
be
is pozitív, akkor a sugár kívülrol
értéknél.
A felesleges metszéspontok számát a Cohen Sutherland szakaszvágó algoritmus (15.4.3 pont) alkalmazásával csökkenthetjük, amelyhez eloször a sugár félegyenesét egy szakasszal váltjuk fel. A szakasz egyik pontja a sugár kezdopontja. A másik pontot pedig a 5
sugáregyenletnek a maximális sugárparaméter melletti értéke adja.
15.6.2. A metszéspontszámítás gyorsítási lehet®ségei algoritmus egy sugarat minden objektummal összevet, és eldönti, Egy naiv sugárköveto hogy van-e köztük metszéspont. Ha N objektum van a térben, a futási ido
Θ(N) mind átla-
gos, mind pedig legrosszabb esetben. A sugárkövetés tárigénye ugyancsak lineáris. A módszer jelentosen gyorsítható lenne, ha az objektumok egy részére kapásból meg tudnánk mondani, hogy az adott sugár biztosan nem metszheti oket (mert például azok a sugár kezdopontja mögött, vagy nem a sugár irányában helyezkednek el), illetve miután találunk egy metszéspontot, akkor ki tudnánk zárni az objektumok egy másik körét azzal, hogy ha a sugár metszi is oket, akkor azok biztosan ezen metszéspont mögött lesznek. Ilyen döntésekhez ismernünk kell az objektumteret. A megismeréshez egy elofeldolgozási fázis szükséges, amelyben a metszéspontszámítás gyorsításához szükséges adatstruktúrát építjük fel. Az elofeldolgozásnak természetesen ára van, amely akkor térül meg, ha utána nagyon sok sugarat kell követnünk. Befoglaló keretek A legegyszerubb gyorsítási módszer a befoglaló keret alkalmazása. A befoglaló keret egy egyszeru geometriájú objektum, tipikusan gömb vagy AABB, amely egy-egy bonyolultabb objektumot teljes egészében tartalmaz. A sugárkövetés során eloször a befoglaló keretet próbáljuk a sugárral elmetszeni. Ha nincs metszéspont, akkor nyilván a befoglalt objek-
5
tmax
= a kamerával együtt értendo színtér átméroje.
649
15.6. Megjelenítés sugárkövetéssel
tummal sem lehet metszéspont, így a bonyolultabb számítást megtakaríthatjuk. A befoglaló keretet úgy kell kiválasztani, hogy a sugárral alkotott metszéspontja könnyen kiszámítható legyen, és kelloen szorosan körbe ölelje az objektumot. idot igényel. A befogA naiv sugárkövetés az objektumok számával lineárisan növekvo laló keretek alkalmazása után az algoritmus továbbra is lineáris. A lineáris tag együtthatója viszont várhatóan kisebb. A befoglaló keretek azonban hierarchikus rendszerbe is szervezhetok, azaz a kisebb keretek magasabb szinteken nagyobb keretekbe foghatók össze. Ekkor a sugárkövetés során a befoglaló keretek által deniált hierarchiát járjuk be, ami szublineáris futási ideju algoritmusokhoz vezethet. Az objektumtér szabályos felosztása Tegyünk az objektumtérre egy szabályos (c x , cy , cz ) cellaméretu, a koordinátatengelyekkel párhuzamos oldalú rácsot (15.31. ábra), amit a teljes objektumteret befoglaló AABB felosztásával kapunk.
v
cx/vx
cy/vy
cy
(xmin ,ymin ,zmin )
cx
15.31. ábra. Az objektumtér szabályos felosztása. A sugárnak a rács egyes koordinátasíkjaival képzett metszéspontjai mindig c x /v x ,cy /vy , illetve cz /vz távolságra vannak.
vagy a celAz elofeldolgozás során minden cellára határozzuk meg a cellában lévo, lába lógó objektumokat. Ehhez az egyes alakzat-cella párokra azt kell megvizsgálni, hogy a cella téglatestének és az alakzatnak van-e közös része. A vizsgálatot megoldhatjuk egy vágási algoritmus (15.4.3. pont) futtatásával is, vagy pedig egyszeruen úgy, hogy ellenorizzük, hogy az alakzat koordinátatengelyekkel párhuzamos oldalú befoglaló téglatestének és a cellának van-e közös része. Ez az egyszeru módszer konzervatív, azaz akkor is belógónak minosíthet egy alakzatot, ha maga nem, csak a befoglaló doboza hatol a cellába. Ez persze a sugárkövetésnél nem okoz hibát, legfeljebb felesleges metszési kísérleteket.
650
15. Számítógépes graka
S - ´ ´ - ´ ´ ´ () 1
számítsuk ki a rács minimális sarkát (xmin , ymin , zmin ) és cella méreteit (c x , cy , cz )
2
for minden c cellára
3
do c cella objektumlistája
4
← üres
for minden o objektumra
5
B A cellába lógó objektumok regisztrálása.
do if a c cella és az o objektum AABB-je egymásba lóg
6
then a c cella objektumlistájához hozzáadjuk az o objektumot
A sugárkövetés fázisában a sugár által metszett cellákat a kezdoponttól való távolságuk sorrendjében látogatjuk meg. Egy cellánál csak azon objektumokat kell tesztelni, amelyek nek van közös része az adott cellával, azaz, amelyeket az elofeldolgozás során a cellában regisztráltunk. Másrészt, ha egy cellában az összes ide tartozó objektum tesztelése után megtaláljuk a legközelebbi metszéspontot, be is fejezhetjük a sugár követését, mert a többi cellában esetlegesen eloforduló metszéspont biztosan a megtalált metszéspontunk mögött van. A cellába lógó objektumok metszése után azt is ellenorizni kell, hogy a metszéspont is a cellában van-e, mert csak ilyen metszéspontokra jelenthetjük ki, hogy a további cellák metszéspontjait megelozik. Elofordulhat, hogy egy objektummal egy késobbi cellában újból találkozunk. Sugár-felület metszéseket takaríthatunk meg, ha a korábbi számításokról nem feledkezünk meg, hanem a vizsgált objektumokhoz hozzárendeljük a korábbi metszésszámítás eredményét. cella Amíg nincs metszéspont, a sugár által metszett cellákon megyünk végig. Az elso X, Y, Z indexei a sugár ~ s kezdopontjából, az objektumokat befoglaló rács (xmin , ymin , zmin ) számíthatók ki: sarokpontjából és a cellák (c x , cy , cz ) méreteibol S - s) ´ ´ - ´ -(~ 1 2 3 4
← E´ ´ ((s x − xmin )/c x ) ← E´ ´ ((sy − ymin )/cy ) Z ← E ´ ´ ((sz − zmin )/cz ) return X, Y, Z X
Y
Ez az algoritmus feltételezi, hogy a sugár kezdopontja is a rács által lefedett tartományban van. Ha ez a feltétel nem állna fenn, akkor ki kell számítani a sugár és a rácsot befoglaló doboz metszéspontját, és oda áthelyezni a sugár kezdopontját. A koordinátánkénti t x , ty , tz sugárparaméterek kezdeti értéke a koordinátasíkokkal metszéspont lesz, melynek koordinátáit a S képzett elso - ´ ´ ´ - ´
-´´ algoritmus határozza meg. cellája egy 3D szakaszrajzoló algoritmus (3DDDA algoritA cellasorozat következo Az algoritmus arra a felismerésre épít, hogy az x (és hamus) segítségével állítható elo. sonlóképpen az y és a z) tengelyre meroleges síkok és a sugár metszéspontjaira érvényes sugárparaméterek mindig c x /v x távolságra (cy /vy , illetve cz /vz távolságra) vannak egymás metszésponthoz tartozó sugárparaméter egyetlen összeadással szától, tehát a következo metszéspontot a t x , ty és tz globális mítható (15.31. ábra). Az x, y és z síkokkal keletkezo sugárparaméter változókban tartjuk nyilván, amelyeket mindig ugyanazzal az értékkel nö cella velünk. A három sugárparaméterérték közül mindig az jelöli ki a tényleges következo metszéspontot, amelyik a legkisebb.
651
15.6. Megjelenítés sugárkövetéssel
S - ´ --´´ (~s, ~v, X, Y, Z) ´ ´ - ´ 1
if v x
>0 ← (xmin + (X + 1) · c x − s x )/v x 0 B ~s a felezosík bal vagy jobb oldalán van? then (közeli, távoli) ← (cella.bal, cella.jobb) B Bal. else (közeli, távoli) ← (cella.jobb, cella.bal) B Jobb. if t > tki vagy t < 0 then cella ← közeli B Csak a közeli cellát metszi. else if t < tbe then cella ← távoli B Csak a távoli cellát metszi. else V(távoli, t, tki ) B Mindkét cellát metszi. cella ← közeli B Eloször a közeli-t. tki ← t B A sugár t-nél lép ki a közeli cellából.
do koordináta d
B Ha az aktuális cella egy levél.
661
15.6. Megjelenítés sugárkövetéssel
← tki
B Maximális sugárparaméter a cellában.
21
t
22
for (a cella listájának o objektumaira)
←S - s, ~ v) B Negatív, ha nincs. ´ - ¨ ´ (~ ≤ to < t B Az új metszéspont közelebbi-e? then t ← to B A legközelebbi metszés sugárparamétere. ometszett ← o B A legközelebb metszett objektum. if t < tki B Volt metszéspont a cellában? then ~ x ← ~ s +~ v·t B A metszéspont helye a sugár egyenletébol. return t, ~ x, ometszett B A metszéspontot megtaláltuk. return -1 B Nincs metszéspont.
23
do to
24
if tbe
25 26 27 28 29 30
tki t
tbe
bal
bal jobb
jobb
d
s
v
s
d>0
d tki
t
jobb
t 0 feltételt.
vetelményként megfogalmazzuk a h
így mindig pozitív. Tehát további köEkkor viszont szorozhatjuk a (15.32)
egyenlotlenségeket h-val, így eljutunk a vágási tartomány homogén koordinátás leírásához:
−h≤
Xh
≤ h,
−h ≤ Yh ≤ h,
− h ≤ Zh ≤ h .
(15.33)
A pontok vágása triviális feladat, hisz a homogén koordinátás alakjukra csak ellenorizni kell, hogy teljesülnek-e a (15.33) egyenlotlenségek. A pontoknál összetettebb primitívekre (szakaszok, sokszögek stb.) azonban ki kell számítani a vágási tartomány határoló lapjaival való metszéspontokat, és a primitívnek pedig csak azt a részét kell meghagyni, amelynek pontjai kielégítik a (15.33) egyenlotlenségeket. A Descartes-koordinátákkal dolgozó vágási algoritmusokkal a 15.4.3. pontban foglalkoztunk. Az ott megismert módszerek alkalmazhatók homogén koordinátákra is, azzal a illetve jelölik ki, hogy egy pont belso, különbséggel, hogy most a (15.33) egyenlotlenségek pontnak minosül-e, külso valamint a szakaszoknak a vágósíkkal képzett metszéspontját a kell számítani. szakasz és a sík homogén koordinátás egyenletébol
669
15.7. Az inkrementális képszintézis algoritmusai
, Yh1 , Zh1 , h1 ] és [Xh2 , Yh2 , Zh2 , h2 ] végpontú szakaszt, amely lehet önálló sokszög egyik éle, és az Xh ≤ h félteret (a többi féltérre a vizsgálat 1 h
Tekintsünk egy [X objektum, vagy egy
teljesen hasonló). Három esetet kell megkülönböztetni: 1.
1 h
pont, azaz X Ha a szakasz mindkét végpontja belso
≤
h
1
és X
≤
2 h
2
h , akkor a teljes
pontokból áll, így megtartjuk. szakasz belso 2.
pont, azaz X Ha a szakasz mindkét végpontja külso
1 h
>
h
1
és X
2 h
>
2
h , akkor a szakasz
pont, így a vágás a teljes szakaszt eltávolítja. minden pontja külso 3.
pont, a másik végpontja belso pont, akkor ki kell Ha a szakasz egyik végpontja külso végpontot fel kell cserélni a számítani a szakasz és a vágósík metszéspontját, és a külso metszésponttal. Figyelembe véve, hogy a szakasz pontjai kielégítik a (15.19) egyenletet, a vágósík pontjai pedig kielégítik az Xh
=
h egyenletet, a metszéspont ti paraméterét a
következoképpen határozhatjuk meg:
Xh (ti )
= h(ti ) =⇒
1
2
Xh · (1 − ti ) + Xh · ti
= h1 · (1 − ti ) + h2 · ti =⇒
ti
=
1 h
X X
1 h
− h1
− Xh2 + h2 − h1
A ti paramétert a szakasz egyenletébe visszahelyettesítve a metszéspont [X
i
h
, Yhi , Zhi , hi ]
koordinátáit is eloállíthatjuk. A vágás során új szakasz végpontok és új sokszög csúcspontok keletkeznek. Ha az eredeti objektum csúcspontjai járulékos információkat is hordoznak (például a felület színét vagy normálvektorát ebben a pontban), akkor a járulékos információkat az új csúcsokra is át kell számítani. Ehhez egyszeru lineáris interpolációt alkalmazhatunk. Ha a járulé1
2
új kos információ értéke a két végpontban I , illetve I , akkor a vágás során keletkezo [Xh (ti ), Yh (ti ), Zh (ti ), h(ti )] pontban az értéke I
1
· (1 − ti ) + I 2 · ti .
15.7.5. A képerny®-transzformáció A perspektív transzformáció után a látható pontok koordinátái a [−1, 1] tartományban van lévo megjelenítési ablak elhelyezkedésének és felbontásának, amelyeket még a képernyon kép bal-alsó sarkát az (Xmin , Ymin ), a nak megfeleloen tolni és skálázni kell. Ha a keletkezo sarkát az (Xmax , Ymax ) pixelen szeretnénk látni, a szemtol való távolságot kifejezo jobb-felso Z koordinátákat pedig a (Zmin , Zmax ) tartományban várjuk, akkor a képernyo-transzformáció mátrixa:
Tkep
A
=
perspektív
(Xmax
− Xmin )/2 0
0 (Ymax
0 (Ymax
transzformáció
utáni
0
0
0
− Zmin )/2 (Zmax + Zmin )/2
1
− Ymin )/2 0
+ Xmin )/2
(Xmax
0
+ Ymin )/2
(Zmax
koordinátarendszerek,
így
0
. a
képernyo-
koordinátarendszer is balsodrású, szemben a virtuális világ és a kamera koordinátarendszereinek jobbsodrású állásával. A balsodrású elrendezés felel meg ugyanis annak a az X koordináták balról-jobbra, az Y koordináták természetes elvárásnak, hogy a képernyon ol távolodva nojenek. alulról-felfelé, a Z koordináták pedig a meggyelot
670
15. Számítógépes graka
15.7.6. Raszterizációs algoritmusok A vágás, a homogén osztás és a képernyo-transzformáció után az alakzataink a képernyokoordinátarendszerben vannak, ahol egy (X, Y, Z) pont vetületének koordinátái úgy határozhatók meg, hogy a koordinátahármasból csak az (X, Y ) párt ragadjuk ki. A raszterizáció során azokat a pixeleket azonosítjuk, amelyek átszínezésével a kép ernyo-koordinátarendszerbe transzformált geometriai alakzat formáját közelíthetjük. A raszterizációs algoritmusok kialakítása során a legfontosabb szempont az, hogy az algoritmus nagyon gyors legyen, és lépései egyszeru hardverrel megvalósíthatók legyenek. Ezt a követelményt azzal magyarázhatjuk, hogy a folyamatos mozgás érzékeléséhez másodpercenként legalább 20 olyan képet kell kiszámítani, amelyek nagyságrendileg egymillió állnak. Így az egyetlen pixelre jutó átlagos számítási ido mindössze 50 nanosec pixelbol lehet. Szakaszok rajzolása Jelöljük a vetített szakasz végpontjait (X1 , Y1 ), (X2 , Y2 )-vel. Tegyük fel továbbá, hogy midon végpontból a második felé haladunk, mindkét koordináta no, és a gyorsabban változó az elso irány az X, azaz
∆X =
X2
− X1 ≥ ∆Y = Y2 − Y1 ≥ 0.
A többi eset a végpontok és az X, Y koordiEbben az esetben a szakasz enyhén emelkedo. felcserélésével analóg módon kezelheto. náták megfelelo elvárás, hogy az átszínezett képA szakaszrajzoló algoritmusokkal szemben alapveto pontok között ne legyenek lyukak, és a keletkezett kép ne legyen vastagabb a feltétlenül szakaszok esetén azt jelenti, hogy minden pixel oszszükségesnél. Ez az enyhén emelkedo lopban pontosan egy pixelt kell átszínezni, nyilván azt, amelynek középpontja a szakaszhoz a legközelebb van. Az egyenes egyenlete:
y
= m · X + b,
ahol
m
=
− Y1 , X2 − X1 Y2
és
b
= Y1 − X1 ·
− Y1 , X2 − X1 Y2
(15.34)
alapján, az X koordinátájú oszlopban a legközelebbi pixel függoleges koordinátája az m · x + b értékhez legközelebbi egész. A képlet minden pixel eloállításához lebegopontos szorzást, összeadást és lebegopontos-egész átalakítást végez, ami megengedhetetlenül lassú. módszere, amelyet inkrementális A gyorsítás alapja a számítógépes graka alapveto elvnek nevezünk. Ez azon a felismerésre épít, hogy általában könnyebben meghatározhatjuk az y(X
+ 1) értéket az y(X) felhasználásával, mint közvetlenül az
Mivel egy enyhén X-bol.
szakasz rajzolásakor az oszlopokat úgyis egymás után látogatjuk meg, az (X + 1)emelkedo dik oszlop feldolgozása során az y(X) már rendelkezésre áll. Egy szakasz esetén:
y(X
+ 1) = m · (X + 1) + b = m · X + b + m = y(X) + m ,
ehhez egyetlen lebegopontos összeadás szükséges (m törtszám). Az elv gyakorlati alkalmazását digitális differenciális analizátor algoritmusnak (DDA-algoritmus) nevezik. A DDAelvu szakaszrajzoló algoritmus:
671
15.7. Az inkrementális képszintézis algoritmusai
DDA- ´ (X1 , Y1 , X2 , Y2 , szín)
← (Y2 − Y1 )/(X2 − X1 ) ← Y1 for X ← X1 to X2 do Y ← K´(y) P-´ ´ (X, Y, szín) y ← y+m
1
m
2
y
3 4 5 6
el xpontos számábrázolás segítségével. Ez azt jelenti, hogy További gyorsítás érheto T
a törtszám 2 -szeresét tároljuk egy egész változóban, ahol T a törtbitek száma. A törtbitek számát úgy kell megválasztani, hogy a leghosszabb ciklusban se halmozódhasson fel akkora hiba, hogy elrontsa a pixelkoordinátákat. Ha a leghosszabb szakasz hossza L, akkor elféro az ehhez szükséges bitek száma log2 L. A vágásnak köszönhetoen csak a képernyon vízszintes, illetve függoleges szakaszokat raszterizáljuk, így L a képernyo felbontásának maximumával egyenlo. A DDA algoritmussal még mindig nem lehetünk teljes mértékben elégedettek. Egyrészt a szoftver implementáció során a xpontos ábrázolás és a kerekítés eltolási (shift) muvele teket igényel. Másrészt igaz szakaszonként csupán egyszer az m meredekség kiszámításához osztani kell. Mindkét problémával sikeresen birkózik meg a Bresenham-algoritmus.
1 t(X+1)
s(X+1)
Y
t(X)
t(X+1)
t(X)
s(X)
s(X+1)
s(X)
X 15.41. ábra. A Bresenham-algoritmus által használt jelölések. Az s a legközelebbi pixelközéppont és a szakasz elojeles távolsága az Y tengely mentén, amely akkor pozitív, ha a szakasz a pixelközéppont felett van. A t a legközelebbi pixelközéppont feletti pixel és a szakasz távolsága az Y tengely mentén.
Jelöljük a szakasz és a legközelebbi pixel középpont függoleges, elojeles távolságát s sel, a szakasz és a legközelebbi pixel feletti pixel függoleges távolságát t-vel (15.41. ábra). oszlopra lépünk, az s és t értékei változnak. Nyilván az eredetileg legAhogy a következo
< t. = s − t hibaváltozót, addig nem kell megváltoztatnunk az átfestendo pixel < 0. Az s, t, e változók számításához az inkrementális elvet használhatjuk
közelebbi pixel sora és az eggyel feletti sor közül addig választjuk az alsó sort, amíg s Bevezetve az e sorát, amíg e
672 (∆ X
15. Számítógépes graka
=
X2
s(X
− X1 , ∆Y = Y2 − Y1 ):
+ 1) =
s(X)
+
∆Y , ∆X
t(X
+ 1) = t(X) −
Ezek az összefüggések akkor igazak, ha az (X
∆Y ∆X
=⇒
e(X
+ 1) = e(X) + 2
∆Y . ∆X
+ 1)-dik oszlopban ugyanazon sorokban lévo
oben. pixeleket tekintjük, mint a megeloz Elofordulhat azonban, hogy az új oszlopban már pixel kerül közelebb a szakaszhoz (az e hibaváltozó pozitívvá válik), így az s, t, e a felso mennyiségeket ezen pixelre és az ezen pixel feletti pixelre kell meghatározni. Erre az esetre képletek vonatkoznak: a következo
∆Y s(X + 1) = s(X) + − 1, ∆X
! ∆Y ∆Y t(X + 1) = t(X) − + 1 =⇒ e(X + 1) = e(X) + 2 −1 . ∆X ∆X
Figyeljük meg, hogy az s elojeles távolságot jelent, azaz az s negatív, ha a szakasz az alsó pixelközéppont alatt található. Feltételezhetjük, hogy az algoritmus indulásakor egy pixel középpontban vagyunk, tehát:
s(X1 )
= 0,
t(X1 )
= 1 =⇒
e(X1 )
=
s(X1 )
− t(X1 ) = −1 .
Az algoritmusnak az e hibaváltozót kell növelnie, és amikor az elojelet vált, a szakasz a pixelsorra lép, mialatt a hibaváltozó ismét a negatív tartományba csúszik vissza. következo A hibaváltozó kezeléséhez nem egész összeadás szükséges, a növekmény meghatározása pedig osztást igényel. Vegyük észre azonban, hogy a hibaváltozó elojelváltásait úgy is nyomon követhetjük, ha nem közvetlenül a hibaváltozóval, hanem annak valamely pozitív számszorosával dolgozunk. Használjuk a hibaváltozó helyett az E
= e · ∆X döntési változót. Enyhén emelkedo
szakaszok esetén a döntési változó pontosan akkor vált elojelet, amikor a hibaváltozó. A döntési változóra érvényes képleteket a hibaváltozóra vonatkozó képletek
∆X-szel
történo
szorzásával kapjuk meg:
E(X + 1) =
E(X)
+ 2∆Y ,
E(X)
+ 2(∆Y − ∆X), ha Y -t léptetni kell
A döntési változó kezdeti értéke pedig E
ha Y -t nem kell léptetni , .
= e(X1 ) · ∆X = −∆X.
indul és minden lépésben egész számmal válA döntési változó egész kezdeti értékrol tozik, tehát az algoritmus egyáltalán nem használ törteket. Ráadásul a növekmények eloállításához csupán egész összeadás (illetve kivonás), és 2-vel való szorzás szükséges. A teljes Bresenham-algoritmus:
673
15.7. Az inkrementális képszintézis algoritmusai
B- ´ (X1 , Y1 , X2 , Y2 , szín) 1 2 3 4 5 6 7 8 9 10 11
∆X ← X2 − X1 ∆Y ← Y2 − Y1 + − (dE , dE ) ← (2(∆Y − ∆ X), 2∆Y ) E ← −∆ X Y ← Y1 for X ← X1 to X2 do if E ≤ 0 − then E ← E + dE B Döntési változó nempozitív, maradunk a pixelsorban. + pixelsorra lépünk. else E ← E + dE B Döntési változó pozitív, a következo Y ← Y +1 P-´ ´ (X, Y, szín)
A Bresenham-algoritmus bevezetésénél a tört hibaváltozót úgy váltottuk ki egy egész változóval, hogy a kritikus egyenlotlenséget az összes változójával együtt egy pozitív szám mal szoroztuk, így az eredeti egyenlotlenséggel ekvivalens, de csak egészeket tartalmazó kifejezéshez jutottunk. Ezt a megközelítést invariánsok módszerének nevezik, és sok raszterizációs eljárásban hasznos segédeszköznek bizonyul. Poligonkitöltés Az
egyszeresen
összefüggo
sokszögeket
kitölto
algoritmus
bemenete
a
csúcsok
~q[0], . . . , ~q[m − 1] tömbje (ez a tömb általában a poligonvágó algoritmus kimenete), amelyben az e-edik él a ~ q[e] és ~ q[e + 1] csúcsokat köti össze. Az utolsó pont különleges kezelését csúcsot még egyszer a vágásnál megismert módon most is megtakaríthatjuk, ha a legelso sokszögeket egynél több zárt töröttbetesszük a tömb végére. A többszörösen összefüggo vonallal, azaz több csúcstömbbel adhatjuk meg.
Y
Y
q[1]
q[1] X0
X1 q[2]
X0 X3
X2 X1 q[3]
q[0] q[3]
q[0] X
q[2]
X
pixeleket vízszintes pásztánként keressük meg. 15.42. ábra. Poligonkitöltés. A sokszög belsejében lévo
A kitöltést célszeruen vízszintes pixelsoronként, azaz pásztánként végezzük. Egyetlen pixelek a következoképpen pásztára az átszínezendo határozhatók meg. Kiszámítjuk a poligon éleinek metszéspontjait a vízszintes pásztával. A metszéspontokat az X koordináta és a második pont közötti, a alapján nagyság szerint rendezzük, majd átszínezzük a elso harmadik és a negyedik pont közötti, általában a (2i
+ 1)-edik és (2i + 2)-edik pont közötti
674
15. Számítógépes graka
pixeleket (15.42. ábra). Ez a módszer azokat a pontokat színezi ki, amelyeket ha végtelen távolból közelítünk meg, akkor páratlan számúszor kell átlépnünk a poligon határán. meggyelésekkel A pászták és az élek metszéspontjainak kiszámítását a következo gyorsíthatjuk: 1.
Egy él és a pászta között csak akkor keletkezhet metszéspont, ha a pászta Y koordinátája az él minimális és maximális Y koordinátája között van, ezért csak ezekre érdemes a metszéspontot kiszámítani. Az ilyen éleket aktív éleknek nevezzük. Az implementációhoz létre kell hoznunk az aktív él listát, amely mindig csak az aktív éleket tartalmazza.
2.
A két szakasz közötti metszéspontszámítás lebegopontos szorzást, osztást és összea dást tartalmaz, ezért idoigényes. Az inkrementális elv felhasználásával azonban a met o pászta metszéspontjából egyetlen xpontos, nemszéspont meghatározható a megeloz egész összeadással (15.43. ábra).
Y+2 Y+1 Y
X ∆X/∆Y X(Y)
∆X/∆Y X(Y+1)
X(Y+2)
15.43. ábra. A pászta és az élek közötti metszéspont inkrementális számítása. Az X koordináta mindig az egyenes meredekségének a reciprokával no.
Az inkrementális elv használatakor gyelembe kell vennünk, hogy az X koordináta nö Y egész értékekre állandó. Ha az él nagyobb Y koordinátájú vekménye az egymást követo végpontjának koordinátái (Xmax , Ymax ), a kisebb Y koordinátájú végpontjának koordinátái pedig (Xmin , Ymin ), akkor a növekmény
∆X/∆Y , ahol ∆X = Xmax − Xmin és ∆Y = Ymax − Ymin . ∆X/∆Y és az X érték tárolására xpontos
A növekmény általában nem egész szám, tehát a
tört ábrázolást kell használnunk. Egy aktív él reprezentációja tehát tartalmazza a xpontos ábrázolású
∆X/∆Y
növekményt, az ugyancsak xpontos ábrázolású X metszéspontot, vala-
mint a szakasz maximális függoleges koordinátáját (Ymax ). Erre azért van szükségünk, hogy el tudjuk dönteni, hogy az Y pászták növelése során mikor fejezi be az él aktív pályafutását, azaz mikor kell eltávolítani az aktív él listából.
AET
Ymax ∆X/∆Y
X
Ymax ∆X/∆Y
X
15.44. ábra. Az aktív él lista szerkezete.
Az Y pásztákat egymás után töltjük ki. Minden pásztára megnézzük, hogy mely élek válnak pont ekkor aktívvá, azaz mely élek minimális Y koordinátája egyezik meg a pászta koordinátájával. Ezeket az éleket betesszük az aktív él listába. Egyúttal az aktív él listát átvizsgáljuk, hogy vannak-e ott nyugdíjba vonuló élek is, amelyek maximális Y koordinátája megegyezik a pászta koordinátájával. A nyugdíjba vonuló éleket kivesszük a listából (ve gyük észre, hogy ebben a megoldásban az él alsó végpontját az él részének tekintjük, a felso
675
15.7. Az inkrementális képszintézis algoritmusai
gondoskodunk arról, hogy az aktív él listában az végpontját viszont nem). A kitöltés elott élek az X koordináta szerint rendezettek legyenek, majd minden második élpár közötti pixeleket átszínezzük. A kitöltés után az aktív él lista tagjaiban a metszéspontokat felkészítjük pásztára, azaz minden él X tagjához hozzáadjuk az él a következo
∆X/∆Y
növekményét.
a következo pásztára. Majd kezdjük az egészet elölrol P ¨ ´ (poligon, szín) 1 2
for Y
← 0 to Ymax
do for a poligon összes él-ére
B Aktívvá váló élek az AET-be.
=Y then AET-R(él)
3
do if él.ymin
4
B Az aktív létet befejezo élek törlése az AET-bol. ≤Y then AET -T ¨ ¨ (él) AET-R B Rendezés X szerint. ´ (él1, él2) párra az AET-ben for minden második egymást követo do for X ← K´(él1.x) to K´(él2.x) do P-´ ´ (X, Y, szín) for minden él-re az AET-ben B Inkrementális elv. do él.x ← él.x + él.∆ X/∆Y
5
for minden él-re az AET-ben
6
do if él.ymax
7 8 9 10 11 11 12
Az algoritmus vízszintes pásztánként dolgozik, egy pászta feldolgozását az aktívvá váló élek (él.ymin
= Y ) aktív listába fuzésével kezdi. Az aktív él listát három muvelet kezeli. Az
AET-R(él) muvelet az él adatai alapján eloállítja az aktív él lista egy elemének az ada rekordot beteszi a listába. Az AET tait (Ymax , ∆ X/∆Y, X), és a keletkezo -T ¨ ¨ muvelet egy listaelemet töröl a listából, amikor egy él éppen befejezi az aktív létet (él.ymax
≤
Y ).
alapján átrendezi a listát. A rendezés után az algoritmus minAz AET-R ´ az X mezo él közötti pixelt kiszínez, és végül az inkrementális képletek den második él és a következo pásztára lépteti. alkalmazásával az aktív él lista elemeit a következo
15.7.7. Inkrementális láthatósági algoritmusok A láthatósági feladatot a képernyo-koordinátarendszerben oldjuk meg. Általában feltételezzük, hogy a felületeket sokszögháló formájában kapjuk meg. Z-buffer algoritmus A z-buffer algoritmus minden pixelre megkeresi azt a felületet, amelynél a pixelen keresztül látható pontban a Z koordináta minimális. A kereséshez minden pixelhez, a feldolgozás adott pillanatának megfeleloen tároljuk az abban látható felületi pontok közül a legközelebbi Z koordinátáját. Ezt a Z értékeket tartalmazó tömböt nevezzük z-buffernek vagy mélységpuffernek. A továbbiakban az egyszeruség, valamint a gyakorlati jelentoség miatt feltételezzük, áll. A háromszögeket egyenként dolgozzuk fel, és meghahogy a felület háromszögekbol tározzuk az összes olyan pixelt, amely a háromszög vetületén belül van. Ehhez egy három algoritmust kell végrehajtani. szögkitölto
676
15. Számítógépes graka
Amint a kitöltés során egy pixelhez érünk, kiszámítjuk a felületi pont Z koordinátáját értékkel. Ha az ott található érték kisebb, akkor a és összehasonlítjuk a z-bufferben lévo már feldolgozott háromszögek között van olyan, amelyik az aktuális háromszöget ebben a pontban takarja, így az aktuális háromszög ezen pontját nem kell kirajzolni. Ha viszont a zbufferbeli érték nagyobb, akkor az idáig feldolgozott háromszögeket az aktuális háromszög takarja ebben a pontban, ezért az aktuális háromszög színét kell beírni a pixelbe és egyúttal a Z értékét a z-bufferbe. A z-buffer módszer algoritmusa tehát: Z--() 1
B Képernyo törlés.
for minden p pixelre do P-´ ´ ( p, háttér-szín)
2
z-buffer[ p]
3 4
← a legnagyobb ábrázolható érték B Rajzolás.
for minden o háromszögre
5
do for az o háromszög vetületének minden p pixelére
6
do Z
7
← az o háromszög p-re vetülo pontjának Z koordinátája < z-buffer[ p] then P-´ ´ ( p, az o színe ebben a pontban) z-buffer[ p] ← Z
if Z
8 9
o fejezet poligonkitölto algoritmusát is, de célszerubb Alkalmazhatnánk az eloz kihasz nálni a háromszög speciális tulajdonságaiból adódó elonyöket. Rendezzük a csúcsokat az Y koordináták alapján és sorszámozzuk újra oket úgy, hogy az elsonek legyen a legkisebb és a harmadiknak a legnagyobb Y koordinátája, és gondolatban vágjuk ketté a háromszöget háromaz Y2 pásztával. Ezzel két hasonló tulajdonságú háromszöget, egy alsó és egy felso (baloldali) és a záró (jobboldali) él nem változik. szöget kapunk, amelyeken belül a kezdo osztályozása attól függ, hogy az A háromszög éleinek jobb-, illetve baloldali élként történo az (X3 , Y3 ) felé tartó irányított egyenes bal, vagy jobb (X2 , Y2 ) vetített csúcs az (X1 , Y1 )-bol oldalán van-e. Ha az (X2 , Y2 ) a bal oldalon található, a vetített háromszöget balállásúnak, egyébként pedig jobbállásúnak nevezzük. A csúcspontok Y koordináta szerinti rendezése, az aka háromszög felvágása és az állás eldöntése után az általános poligonkitöltonkb ol tív él lista adminisztrációja kihagyható, csupán az inkrementális metszéspontszámítást kell megtartani. Az algoritmus részleteinek a bemutatása során feltesszük, hogy aktuálisan az
~r1 = [X1 , Y1 , Z1 ],
~r2 = [X2 , Y2 , Z2 ],
~r3 = [X3 , Y3 , Z3 ]
kell csúcspontokkal deniált háromszöget dolgozzuk fel. A raszterizációs algoritmusnak elo X, Y pixel címeket a Z koordinátákkal együtt (15.45. állítania a háromszög vetületébe eso ábra). a megfelelo Z koordinátát a háromszög síkjának az egyenletébol Az X, Y pixel címbol számíthatjuk ((15.1) egyenlet), amely szerint a Z koordináta az X, Y koordináták lineáris függvénye. A háromszög síkjának az egyenlete: nX
· X + nY · Y + nZ · Z + d = 0,
ahol ~ n
= (~r2 −~r1 ) × (~r3 −~r1 )
és
d
= −~n ·~r1 .
(15.35)
A háromszög balállású, illetve jobbállású voltát a normálvektor Z koordinátájának elojele
677
15.7. Az inkrementális képszintézis algoritmusai
Z(X,Y)
r3 =(X3 , Y3 , Z3 )
n
r1 =(X1 , Y1 , Z1 )
r2 =(X2 , Y2 , Z2 )
Y X,Y X vetületébe eso pixe15.45. ábra. Egy háromszög a képernyo-koordinátarendszerben. A háromszög XY síkon levo pont Z koordinátáját a háromszög síkjának egyenletébol számítjuk. leket látogatjuk meg. A pixeleknek megfelelo
alapján állapíthatjuk meg. Ha nZ negatív, a háromszög balállású, ha pozitív, akkor jobbál egyetlen szakasz lesz, így lású. Ha nZ zérus, akkor a vetítés következtében a háromszögbol a kitöltésére nincs szükség. a Z(X, Y ) függvény: A háromszög síkjának az egyenletébol Z(X, Y )
=−
nX
· X + nY · Y + d nZ
.
(15.36)
Az inkrementális elv felhasználásával ezen képlet jelentosen egyszerusíthet o: Z(X
+ 1, Y ) = Z(X, Y ) −
nX nZ
= Z(X, Y ) + δZX .
(15.37)
(X3 ,Y3 ,Z3 )
Y Z = Z(X,Y) Z
X
(X2 ,Y2 ,Z2 ) δXs Y
δ ZX δXe Y δZ s Y
(X1 ,Y1 ,Z1 )
15.46. ábra. Inkrementális Z érték számítás egy balállású háromszögre.
Mivel a
δZX
paraméter állandó az egész háromszögre, csak egyszer kell kiszámítani.
Egyetlen pásztán belül a Z koordináta kiszámítása tehát egyetlen összeadást igényel. A ha tárvonalakat a poligonkitöltésnél megismert módon ugyancsak eloállíthatjuk az inkrementá a határvonal mentén a pászták kezdeti Z koordinátája is egyetlen lis elv felhasználásával, sot
678
15. Számítógépes graka
o pászta kezdeti Z koordinátájából (15.46. ábra). A telösszeadással kiszámítható a megeloz jes inkrementális algoritmus, amely egy balállású háromszög alsó felét tölti ki (a jobbállású felet kitölto algoritmus nagyon hasonló): eset, illetve a felso Z-- ´ - ´ ´ ¨ (X1 , Y1 , Z1 , X2 , Y2 , Z2 , X3 , Y3 , Z3 , szín) 1 2 3 4 5 6 7 8 9 10 11 12
~n ← ((X2 , Y2 , Z2 ) − (X1 , Y1 , Z1 )) × ((X3 , Y3 , Z3 ) − (X1 , Y1 , Z1 )) B Normálvektor. δZX ← −nX /nZ B Z inkremens, ha X eggyel no. s s e (δ XY , δZY , δ XY ) ← ((X2 − X1 )/(Y2 − Y1 ), (Z2 − Z1 )/(Y2 − Y1 ), (X3 − X1 )/(Y3 − Y1 )) (Xbal , Xjobb , Zbal ) ← (X1 , X1 , Z1 ) for Y ← Y1 to Y2 do Z ← Zbal for X ← K´(Xbal ) to K´(Xjobb ) B Egy pászta rajzolása. if Z < z-buffer[X, Y ] B Takarás vizsgálat. then P-´ ´ (X, Y, szín) z-buffer[X, Y ] ← Z Z ← Z + δZX s s e B Következo pászta. (Xbal , Xjobb , Zbal ) ← (Xbal + δ XY , Xjobb + δ XY , Zbal + δZY ) pixelek azoA megismert algoritmus a háromszög kitöltés, azaz a háromszögben lévo
nosításával párhuzamosan lineárisan interpolálja a Z koordinátát. A lineáris interpolációhoz Ugyanez a megoldás más háromszög tulajdonsápixelenként egyetlen összeadás elegendo. gok esetén is alkalmazható. Például, ha ismerjük a háromszög csúcsainak színét, a belso pontokra folytonos színátmenetet valósíthatunk meg a szín lineáris interpolációjával [166]. Ha a számokat xpontosan ábrázoljuk, a lineáris interpolátor egyszeru áramköri elemek felhasználásával hardverben is realizálható. A mai grakus kártyák ilyen egységekkel rendelkeznek. A z-buffer algoritmus a háromszögeket egyenként tölti ki, így
Θ(N ·
igényel, P) idot
ahol N a háromszögek, P pedig a kép pixeleinek a száma. A gyakorlatban a helyzet ennél így kedvezobb, mert a háromszögek száma általában a tesszelláció nomítása miatt no, ha több háromszögünk van, akkor méretük is kisebb, tehát kitöltésükhöz kevesebb pixel így a háromszögek vetületei által lefedett pixelszámmal arányos, szükséges. A futási ido amely ekkor csak a felbontástól függ, azaz
Θ(P) típusú.
Warnock-algoritmus felületelemek a képen összefüggo pixeltartományon keresztül látszanak. Ezen A különbözo koherencia tulajdonság miatt célszeru a láthatóságot a pixelnél nagyobb egységekre vizsgálni. A vetített poligonok és az ablak lehetséges viszonyai alapján, a 15.47. ábra szerint, metszo és tartalmazott poligonokat különböztethetünk meg. Ha szekülönálló, körülvevo, poligonok vannak. A rencsénk van, akkor az objektumtérben csak különálló és körülvevo sokkülönálló sokszögek nem látszhatnak, így ezekkel nem kell foglalkozni. A körülvevo szögek vetülete pedig az összes pixelt magában foglalja. Ha feltételezhetjük, hogy a sok poligonok közül csak egyetlen egy látható, szögek nem metszik egymást, akkor a körülvevo sugár követésével választhatunk ki. amelyet például az ablak középpontján átmeno Az egyetlen sugár követésével megoldható szerencsés eset akkor áll fenn, amikor egyet len poligonél sem vetül az ablakra. Ezt úgy ellenorizhetjük, hogy a poligonélek vetületére
679
15.7. Az inkrementális képszintézis algoritmusai
poligon poligon ablak
ablak
(a)
(b)
poligon ablak
(c)
ablak poligon (d)
(), metszo (), tartalmazott (). 15.47. ábra. Poligon-ablak relációk: különálló (), körülvevo
alkalmazzuk a kétdimenziós szakaszvágó algoritmust (15.4.3. pont). Ha a vágás minden szakaszra úgy találja, hogy a szakasz teljes egészében eldobandó, akkor a sokszögek valóban típusúak lehetnek. Ha viszont nem vagyunk ebben a szerencsés csak különálló és körülvevo helyzetben, akkor az ablakot négy egybevágó ablakra bontjuk fel, és újra megvizsgáljuk, hogy szerencsénk van-e vagy sem. Az eljárás, amelyet Warnock-algoritmusnak neveznek, rekurzívan ismételgeti ezt a lépést, amíg vagy sikerül visszavezetni a takarási feladatot a szerencsés esetre, vagy az ablak mérete a pixel méretére zsugorodik. A pixel méretu ablaknál az újabb felosztások már értelmetlenné válnak, így erre a pixelre már a szokásos módon (például sugárkövetéssel) kell megoldanunk a takarási feladatot. A módszer algoritmusának leírása során (X1 , Y1 )-gyel jelöljük az ablak bal-alsó sarkának és (X2 , Y2 )-vel a jobb-felso sarkának egész értéku koordinátáit: W-(X1 , Y1 , X2 , Y2 ) 1 2
if X1
,
B Az ablak a pixelnél nagyobb? B Ablakfelezés és rekurzió. then W-(X1 , Y1 , (X1 + X2 )/2, (Y1 + Y2 )/2) W-(X1 , (Y1 + Y2 )/2, (X1 + X2 )/2, Y2 ) W-A((X1 + X2 )/2, Y1 , X2 , (Y1 + Y2 )/2) W-A((X1 + X2 )/2, (Y1 + Y2 )/2, X2 , Y2 )
X2 vagy Y1
, Y2
then if legalább egy él esik az ablakba
3 4 5 6 7
return
8
B Triviális eset: az (X1 , Y1 , X2 , Y2 ) téglalap homogén. poligon ← az ((X1 + X2 )/2, (Y1 + Y2 )/2) pixelben látható poligon
9
if nincs poligon
10
then (X1 , Y1 , X2 , Y2 ) téglalap kitöltése háttér színnel
11
else (X1 , Y1 , X2 , Y2 ) téglalap kitöltése a poligon színével
algoritmus Festo A festés során a késobbi ecsetvonások elfedik a korábbiakat. Ezen egyszeru elv kiaknázásához rendezzük a poligonokat oly módon, hogy egy P poligon csak akkor állhat a sorrendben egy Q poligon után, ha nem takarja azt. Majd a poligonokat a kapott sorrendben visszafelé haladva egymás után raszterizáljuk. Ha egynél több poligon vetül egy pixelre, a pixel színe az utoljára rajzolt poligon színével egyezik meg. Mivel a rendezés miatt a korábban rajzoltak nem takarhatják az utolsó poligont, ezzel a festo algoritmussal a takarási feladatot megoldottuk.
680
15. Számítógépes graka
rendezése több problémát is felvet, ezért vizsgáljuk meg ezt a A poligonok megfelelo kérdést részletesebben. Azt mondjuk, hogy egy
P poligon nem takarja a Q poligont, ha P nek semelyik pontja sem takarja Q valamely pontját. Ezen reláció teljesítéséhez a következo feltételek valamelyikét kell kielégíteni:
1.
a P poligon minden pontja hátrébb van (nagyobb Z koordinátájú) a Q poligon bármely pontjánál;
2.
a P poligon vetületét befoglaló téglalapnak és a Q poligon vetületét befoglaló téglalapnak nincs közös része;
3.
mint a Q síkja; P valamennyi csúcsa (így minden pontja) messzebb van a szemtol,
4.
Q valamennyi csúcsa (így minden pontja) közelebb van a szemhez, mint a P síkja;
5.
a P és Q vetületeinek nincs közös része.
A felsorolt feltételek bármelyike elégséges feltétel, amelyek ellenorzése a sorrendnek meg feleloen egyre nehezebb, ezért az ellenorzéseket a fenti sorrendben végezzük el. lépésként rendezzük a poligonokat a maximális Z koordinátájuk szerint úgy, hogy Elso a közeli poligonok a lista elején, a távoli poligonok pedig a lista végén foglaljanak helyet. Ez önmagában még nem elég, hiszen elofordulhat, hogy az így kapott listában valahol borul a
P poligon nem takarja a Q poligont reláció. Ezért minden egyes poligont össze kell vetni valamennyi, a listában elotte álló poli-
gonnal, és ellenorizni kell a megadott feltételeket. Ha azok valamelyike minden elobb álló Ha viszont a poligonunk takar poligonra teljesül, akkor az adott poligon helye megfelelo. egy elobb álló poligont, akkor a takart poligont az aktuális poligon mögé kell vinni a listá ban, és a mozgatott poligonra visszalépve újra kell kezdeni a feltételek ellenorzését.
Q P
R
Q1 P1 Q2
P2
P
Q 15.48. ábra. Ciklikus takarás, amelyet úgy oldhatunk fel, hogy az egyik sokszöget a másik síkjával kettévágunk.
Elofordulhat, hogy ez az algoritmus végtelen ciklusba kerül. Például ha két poligon egymást kölcsönösen takarja (15.48. ábra bal oldala), az ismertetett algoritmus ezen két esetet mutat be ugyanezen poligont vég nélkül cserélgetné. Még nehezebben felismerheto ábra jobb oldala, amikor kettonél több poligon ciklikus takarásának lehetünk tanúi. vágásával oldhatjuk fel, és ezáltal Ezeket a ciklikus átlapolásokat a poligonok megfelelo átsegíthetjük az algoritmusunkat a kritikus pontokon. A ciklikus átlapolások felismeréséhez a mozgatáskor a poligonokat megjelöljük. Ha még egyszer mozgatni kell oket, akkor va hogy ennek oka a ciklikus átlapolás. Ekkor az újból mozgatott poligont a lószínusíthet o, másik poligon síkja mentén két részre vágjuk.
681
15.7. Az inkrementális képszintézis algoritmusai
BSP-fa A BSP-fa egy bináris térpartícionáló fa, amely minden szinten a reprezentált térrészt egy alkalmas síkkal két részre bontja. A BSP-fa egy közeli rokona a 15.6.2. pontban megismert kd-fa, amely koordinátatengelyekkel párhuzamos elválasztó síkokat használ. Jelen fejezetünk BSP-fája azonban a háromszögek síkját választja elválasztó síkként. A fa csomópontjaiban sokszögeket találunk, amelyek síkja választja szét a két gyerek által deniált térrészt (15.49. ábra). A fa levelei vagy üresek, vagy egyetlen sokszöget tartalmaznak. BSP-- A BSP-fát felépíto ´ ´ ´ algoritmus egy S sokszöglistát kap. Az algoritmusban a bináris fa egy csomópontját csomópont-tal, a csomóponthoz tartozó sokszöget csomópont.sokszög-gel, a csomópont két gyerekét pedig csomópont.bal-lal, illetve csomópont.jobb-bal jelöljük. Egy ~ r pontot az ~ n
· (~r − ~r0 )
skaláris szorzat elojele alapján
sorolunk az ~ n normálvektorú és ~ r0 helyvektorú sík nem negatív (jobb) és negatív (bal) tartományába. BSP-- ´ ´ ´ (S ) 1
hozzunk létre egy új csomópont-ot
2
if S üres vagy egyetlen sokszöget tartalmaz
←S ← üres csomópont.jobb ← üres else csomópont.sokszög ← egy sokszög az S
3
then csomópont.sokszög
4
csomópont.bal
5 6
listából
7
távolítsuk el csomópont.sokszög-et az S listából
8
a csomópont.sokszög síkjának nemnegatív félterébe lógók ← S -bol a csomópont.sokszög síkjának negatív félterébe lógók ← S -bol + csomópont.jobb ← BSP-fa-felépítés(S ) − csomópont.bal ← BSP-fa-felépítés(S )
9 10 11 12
S
+
S
−
return csomópont
P3
P1
P1 P4 P2
P2
P3 P4
null
15.49. ábra. A BSP-fa. A térrészeket a tartalmazott sokszögek síkjai osztják fel.
A hatékonyság érdekében a BSP-fát úgy érdemes felépíteni, hogy mélysége minimális legyen. A BSP-fa mélysége függ az elválasztó síkot meghatározó sokszög kiválasztási stratégiájától, de ez a függés nagyon bonyolult, ezért heurisztikus szabályokat kell alkalmazni. A BSP-fa segítségével megoldhatjuk a takarási feladatot. A sokszögeket a fa bejárása során rajzoljuk fel. Minden csomópontnál eldöntjük, hogy a kamera a csomópont síkjának
682
15. Számítógépes graka
melyik oldalán van. Eloször azon gyerek irányába lépünk, amely a kamera átellenes oldalán van, majd felrajzoljuk a csomópont saját sokszögét, végül pedig a kamera oldali gyereket dolgozzuk fel.
Gyakorlatok válto15.7-1. Készítsük el a Bresenham-algoritmus teljes, mind a 8 síktartományt kezelo zatát. eljárás minden pásztára minden élt megvizsgál, hogy az aktív él 15.7-2. A poligonkitölto listába teheti-e oket. Módosítsuk az eljárást, hogy erre minden élre csak egyszer legyen szükség. 15.7-3. Készítsük el a z-buffer algoritmus teljes változatát, amely mind balállású, mind pedig jobbállású háromszögekre muködik. 15.7-4. Az átlátszó tárgyak színét egy egyszeru modell szerint a tárgy saját színének és a mögöttes tárgy színének súlyozott átlagaként számíthatjuk. Mutassuk meg, hogy ekkor az algoritmus és a BSP-fa ad helyes megismertetett takarási algoritmusok közül csak a festo oldást. 15.7-5. Az ismertetett Warnock-algoritmus akkor is felbontja az ablakot, ha arra egyetlen sokszög éle vetül. Javítsuk a módszert úgy, hogy ebben az esetben a poligont már újabb rekurziók nélkül felrajzolja. 15.7-6. Alkalmazzuk a BSP-fát diszkrét ideju ütközésfelismeréshez. eljárás térpartícionáló adatszerkezeteként. 15.7-7. Alkalmazzuk a BSP-fát a sugárköveto
Feladatok 15-1. Megjeleníto rendszer sugárkövetéssel rendszert a sugárkövetés algoritmusával. A testeket háromszögháKészítsünk megjeleníto renlóval, illetve kvadratikus felületként adjuk meg, és diffúz fényvisszaverodési tényezot delünk hozzájuk. A virtuális térben pontszeru fényforrásokat is felveszünk. Egy pont látható színe arányos a diffúz fényvisszaverodési tényezovel, a fényforrás teljesítményével, a pontot irány és a felületi normális közötti szög koszinuszával (Lamberta fényforrással összeköto féle koszinusz-törvény), és fordítottan arányos a pont és a fényforrás távolságával. A fényforrások láthatóságának eldöntéséhez ugyancsak a sugárkövetést használjuk. 15-2. Folytonos ideju ütközésfelismerés sugárkövetéssel algoritA sugárkövetés felhasználásával adjunk javaslatot egy folytonos ütközésfelismero musra, amely egy mozgó, forgó poliéderre és egy mozdulatlan síkra kiszámítja az ütközés várható idejét. A megoldás során a poliéder csúcsainak mozgását kis dt idointervallumokban egyenesvonalú egyenletes mozgásnak tekintsük. 15-3. Megjeleníto rendszer inkrementális képszintézissel rendszert, amelyben a modellezési és Készítsünk teljes háromdimenziós megjeleníto háromszögenként adjuk kamera-transzformációk beállíthatók. A virtuális világ szereploit meg, a csúcspontokhoz színinformációt is kapcsolva. A transzformációk és vágás után z pontok színének számításánál buffer algoritmussal oldjuk meg a takarási feladatot, a belso pedig a csúcspontok színét lineárisan interpoláljuk.
683
15. Megjegyzések a fejezethez
Megjegyzések a fejezethez Hajós György [189] kiváló könyAz euklideszi, analitikus és projektív geometria elemeirol vében, a projektív geometriáról általában Maxwell [314, 315] és Coxeter [92] muveiben, a számítógépes grakai alkalmazásáról pedig Herman Iván [204] és Krammer Gergely [266] cikkeiben olvashatunk. A görbék és felületek modellezésével a számítógépes geometriai tervezés (CAD, CAGD) foglalkozik, amelyet átfogóan Gerald Farin [125], valamint Ro történo gers és Adams [395] tárgyalnak. A geometriai modellek mérési eredményekbol felépítése a mérnöki visszafejtés [481] területe. Az implicit felületek tanulmányozásához leírása napBloomenthal muvét [54] ajánljuk. A testeknek implicit egyenletekkel történo jainkban újabb reneszánszát éli a funkcionális-reprezentáció (F-Rep) alapú modellezés elterjedésével, amelynek részleteivel a http://cis.k.hosei.ac.jp/F-rep honlap foglalkozik. A cseppmodellezésre eloször Blinn tett javaslatot [53]. Késobb az általa javasolt exponenciális függvényt kicserélték polinomfüggvényekre [502]. A polinomfüggvények, különösen a másodfokú alakok azért népszeruek, mert ekkor a sugárkövetés során csak másodfokú egyenleteket kell megoldani. A geometriai algoritmusok a geometriai problémákra mint a konvex burok létrehozása, metszés, tartalmazás vizsgálat, háromszögekre bontás, geometriai keresés stb. adnak megoldást. A témakörrel az Új algoritmusok címu könyv egy fejezete is foglalkozott, további információk Preparata és Shamos [376], valamint Marc de Berg muveiben [101, 102] sokszögek háromszögekre bontalálhatók. A egyszeru vagy akár többszörösen összefüggo tásához robusztus algoritmust adni annak ellenére meglepoen nehéz, hogy a témakör már évtizedek óta fontos kutatási terület. A gyakorlatban használt algoritmusok O(n lg n) idoben futnak [102, 422, 506], bár Chazelle [74] egy optimális, lineáris ideju algoritmus elvét is származik [357]. A hákidolgozta. A két fül tétel idézett bizonyítása Joseph O'Rourke-tol pillangó felosztást Dyn és társai [117] javasolták. A Sutherland romszöghálókon muköd o Hodgeman-poligonvágást a [442] cikk alapján mutattuk be. Az ütközésfelismerés a számítógépes játékok [450] egyik legkritikusabb algoritmusa. a falakon átléphessenek, valamint ezzel Ez akadályozza meg ugyanis, hogy a szereplok dönthetjük el, hogy egy lövedék eltalált-e valamit a virtuális térben. Az ütközésfelismerési sok algoritmusokat Jiménez, Thomas és Torras tekintik át [230]. A felosztott felületekrol [70], Warren és Heimer hasznos információt kaphatunk Catmull és Clark eredeti cikkébol [485], valamint Brian Sharp ismertetoib ol [429, 428]. A pillangófelosztást Dyn, könyvébol Gregory és Levin [117] javasolta. A sugárkövetés elveivel Glassner [154] könyvében ismerkedhetünk meg. A 3D sza kaszrajzoló algoritmust Fujimoto és társai [143] cikke alapján tárgyaljuk. A sugárköveto algoritmusok bonyolultságát számos publikációban vizsgálták. Bebizonyosodott, hogy N objektumra a sugárkövetési feldatot O(lg N) idoben meg lehet oldani [101, 451], de ez csak elméleti eredmény, mert ehhez
Ω(N 4 )
szükséges, és memóriaigény és elofeldolgozási ido
a konstans szorzó is olyan nagy, hogy az eroforrásigény a gyakorlat számára elfogadhatatlan. A gyakorlatban inkább a fejezetben is tárgyalt heurisztikus módszereket alkalmazzák, amelyek a legrosszabb esetben ugyan nem, de várható értékben csökkentik a sugárkövetési feladat megoldási idejét. A heurisztikus módszereket Márton Gábor [339, 451] elemezte javasolta a fejezetben is használt modellt. A heurisztivalószínuségi módszerekkel, és o kus algoritmusokról, elsosorban a kd-fa alapú módszer hatékony megvalósításáról Vlastimil Havran disszertációjában [196] olvashatunk, egy konkrét, optimalizált megvalósítás pedig
684
15. Számítógépes graka
Szécsi László cikkében [444] található. A virtuális világ valószínuségi modelljében használt Poisson-pontfolyamat ismertetése megtalálható például Karlin és Taylor [240] és Lamperti [275] könyveiben. Az alkalmazott cellafelezési módszer Havrantól [196] származik. Az idézett integrálgeometriai tétel megtalálható Santaló[412] könyvében. A négyfa és az oktálisfa geoinformatikai alkalmazásait a könyv 16. fejezete tárgyalja. Az inkrementális képszintézis algoritmusaival Jim Blinn foglalkozik részletesen [53], C++ nyelvu implementációt a [448] könyvben találhatunk, valamint más általános számítógépes graka könyvekhez is fordulhatunk [133, 450]. A láthatósági algoritmusok összehasonlító elemzését például a [443, 449] muvekben találjuk meg. A Bresenham-algoritmus forrása [58]. Az inkrementális képszintézis algoritmusok, és azokon belül a z-buffer algoritmus, a valós-ideju megjelenítés legnépszerubb módszere, ezért a grakus kártyák ennek lépéseit valósítják meg, és az elterjedt grakus könyvtárak is (OpenGL, DirectX) erre a megközelítésre épülnek. A takarási feladatot megoldó festo algoritmust Newell és társai [349] javasolták. A BSP-fa felépítésére Fuchs [142] javasolt heurisztikus szabályokat. A mai grakus hardver több szinten programozható, ezért a megjelenítési algorit arra is lehetoség muslánc muködését módosíthatjuk. Sot van, hogy a grakus hardveren nem grakus számításokat végezzünk el. A grakus hardver a nagyon nagyfokú párhu zamosságnak köszönhetoen óriási teljesítményu, de a felépítése miatt csak speciális algoritmusok végrehajtására képes. Már megjelentek olyan, a grakus hardverre optimalizált algoritmusok, amelyek általános célú feladatokat oldanak meg (lineáris egyenletek, gyors Fourier-transzformáció, integrálegyenletek megoldása stb.). Ilyen algoritmusokról a http://www.gpgpu.org honlapon és Randoma Fernando könyvében [128] olvashatunk.
16. Térinformatika
A térinformatika (vagy geoinformatika) a térképészet és az informatika határán kialakult tudományterület. Ebben a fejezetben a legfontosabb térinformatikai fogalmakat és módszereket mutatjuk be: a 16.1. alfejezetben az adatmodellekkel, a 16.2. alfejezetben a térbeli indexeléssel, a 16.3. alfejezetben a digitális szurési eljárásokkal, és végül a 16.4. alfejezetben a mintavételezéssel foglalkozunk.
16.1. A térinformatika adatmodelljei digiA térinformatikában az adatok tekintélyes részét teszik ki a térbeliséget megtestesíto tális térképek. Ezeknek alapvetoen két nagy csoportja van: az egyik csoportot a vektoros a másik csoportot pedig a raszteres adatmodellt követo térképek alkotadatmodellt követo, ják. A kétféle térkép nagymértékben különbözik egymástól, mivel lényegesen különbözo adatmodellre épülnek. Az 16.1. ábrán a mintaterület egy nem térképszeru ábrázolását látjuk, amelynek vektoros, majd a raszteres reprezentációját is ismertetjük.
16.1. ábra. A mintaterület madártávlatból.
686
16. Térinformatika
16.2. ábra. A mintaterület vektoros modellje.
16.1.1. A vektoros adatmodell A vektoros rendszerek helyvektorokkal írják le az objektumok térbeliségét megadó jellegzetes pontokat (és egy összekötési szabállyal mondják meg, hogy mely pontok alkotnak poligont, vonalat vagy vonalláncot). A vektoros rendszerek nagy elonye, hogy nemcsak komplex objektumok létrehozására alkalmasak, hanem a relációs hierarchikusan felépülo adatkapcsolatok kiépítése is viszonylag könnyen megvalósítható. A vektoros térképekhez kapcsolódnak az objektumokat leíró adatok, amelyek megjelenítése és elemzése a térinfor feladata. A vektoros adatok eroforrásigénye matikai funkciókör egyik fo lényegesen kisebb, mint a rasztereseké. A 16.2. ábrán az elobbi terület vektoros modellje látható.
16.1.2. A raszteres modell területe. Adatainak forrása A raszteres rendszerek világa a térinformatika másik jelentos a digitális kép. A digitális kép elemi objektuma a pixel, azaz a legkisebb képpont, amit a képalkotó eszköz még képes létrehozni. A képalkotó eszköz nemcsak muhold lehet, hanem akár egy egyszeru szkenner, vagy egy digitális fényképezogép. A pixel optikai állapota homogén, azaz színe, fényereje a pixelen belül állandó. A raszteres rendszerek a meggyelt felületet egy n
× m-es
mátrixra képezik le (n a sorok, m az oszlopok száma). A kép által
ekkor a kép térképátfogott földterület alapján a pixelnek valós méret is megfeleltetheto, ként is használható. A 16.3. ábrán a mintaterület raszteres modelljét láthatjuk. A raszteres térképek legnagyobb elonye a felszín rendkívül részlet-gazdag leírása. Hátrányuk a nagy eroforrásigény, és a bonyolult objektumok felépítésének, valamint a relációs adatkapcsolatok létrehozásának nehézsége.
Gyakorlatok 16.1-1. Hasonlítsuk össze a vektoros és raszteres adatmodellt.
687
16.2. Térbeli indexelés
16.3. ábra. A mintaterület raszteres modellje.
16.2. Térbeli indexelés A digitális térképek kezelése mind raszteres, mind a vektoros adatmodell esetében álta lában nagy eroforrásigény u. Az ilyen térképekkel dolgozó térinformatikai rendszerek alapja rendszer, ami megoldja a térbeli objektumok tárolását, általában valamilyen adatbáziskezelo minoség kezelését, valamint lehetoséget biztosít interaktív használatra. A megfelelo biztosításához speciális módszerek állnak rendelkezésünkre, melyek támogatják a szintén speci objektumok lekérdezése ális muveleteinket mint amilyenek például az adott területre eso (tartomány-lekérdezések), adott koordinátát tartalmazó objektumok lekérdezése, legközelebbi szomszéd keresése, vagy a térbeli összekapcsolás. A következokben a legfontosabb muveletre, az adatbázis tartalmának megjelenítésére koncentrálunk. Megjelenítéskor megfeleltetést hozunk létre az adatbázis tartalma és a meg eszköz között (16.4. ábra). A szürke terület az adatbázisunk által lefedett síkrész jeleníto teljes kiterjedését mutatja, míg a fehér terület az úgynevezett viewport, amely a megtekinteni kívánt területet jelzi. A megjelenítés legegyszerubb módja lenne beolvasni az egész adatrendszert a memóriába, és onnan végezni a kirajzolást. Ez az eljárás több szempontból Egyrészt minek beolvasni olyan területek adatait, amik kívül esnek a viewsem követendo. porton, másrészt a memória mérete sem korlátlan, és célszeru csak a látni kívánt terület adatait betölteni. Bonyolítja a helyzetet, hogy a háttértár (lemez) lényegesen lassabb muködés u, mint a memória, valamint hogy a háttértár adatait hatékonysági okokból nagyobb egységekben, úgynevezett blokkokban kezelhetjük. Egy elemi olvasási vagy írási muvelet tehát egy blokk olvasását vagy írását jelenti, a muvelet sebessége pedig alapvetoen az érintett blok segítséget nyújt az eloz oekben kok számától függ. A térképi adatok indexelése megfelelo felvázolt keresési problémák megoldásához. Az indexelés során olyan adatstruktúrákat ho objektumok zunk létre, melyek segítségével adott tulajdonságú (például a viewportba eso) anélkül, hogy az összes objektum térbeli elhelyezkedését meg hatékonyan visszanyerhetok kellene vizsgálnunk. objektumok gyors megjelenítéséhez tehát ki kell tudnunk zárni a A viewportba eso a viewporton kívüli területeket. Sajnos, a hagyományos adatbázis-kezelokben keresésbol megszokott indexelési technikák mint az általánosan használt B-fa térbeli indexelésre
688
16. Térinformatika
16.4. ábra. A viewport és az adatbázis térbeli kiterjedésének viszonya.
16.5. ábra. Konvex és konkáv poligonok centroidjai.
nem alkalmasak, mivel csak az egy dimenzió (attribútum) szerinti lekérdezéseket támogat ják hatékonyan. Ezzel szemben a térinformatikai adatok lekérdezései jellemzoen két vagy három dimenzió, azaz két vagy három koordináta szerinti kereséseknek felelnek meg. Még mielott rátérnénk néhány térbeli indexelési algoritmus bemutatására, ismerkedjünk meg a centroid és a befoglaló téglalap fogalmával. A centroid egy olyan pont, amely a poligon belsejében van, és alkalmas a poligon térbeli elhelyezkedésének ábrázolására. Kon deníciója a poligon súlypontja, míg konkáv vex poligonok esetében a centroid kézenfekvo belso pont (konkrét deníciója többféleképp is lehetséesetben egy súlyvonalra illeszkedo ges és elterjedt) (16.5. ábra). A befoglaló téglalap (MBR) az a legkisebb területu téglalap, melynek oldalai párhuzamosak a koordináta-tengelyekkel, valamint teljes egészében tartalmazza a kérdéses objektumot (16.6. ábra). A befoglaló téglalap ábrázolásához mindössze csúcsok használata általánosnak mondható. két pont szükséges, a bal alsó és jobb felso A következokben feltesszük, hogy az adatbázisban síkbeli objektumokat tárolunk a vektoros adatmodellnek megfeleloen. Az objektumok lehetnek nulladimenziósak, vagyis egy darab ponttal reprezentáltak, lehetnek egydimenziósak, mint például utak, folyók vagy általában a vonalláncok, vagy kétdimenziósak, például poligonok. A fent bevezetett két fogalom a poligonok, vonalláncok, valamint általában síkbeli objektumok helyettesítésére való. Azért használjuk oket, mert a térbeli indexeléskor ezen egyszeru objektumokkal repre zentáljuk az idonként rendkívüli összetettségu térbeli objektumokat.
689
16.2. Térbeli indexelés
objektum
befoglaló téglalap 16.6. ábra. A befoglaló téglalap.
1
2
3
.
.
.
B
A
D C
.
E
.
.
40
F méretu 16.7. ábra. Különbözo objektumok egy adott rácsállandójú négyzethálón.
A térbeli adatok indexelési módszerei vagy a térbeli objektumokat, vagy pedig a vizs gált térrészt osztják fel részekre. A következokben bemutatott módszerek a második kategóriába sorolhatók, tehát a tér valamely felosztásával próbálják gyorsítani az objektumok elérését.
16.2.1. Grid index Illesszünk a síkbeli objektumainkat tartalmazó síkrészre egy szabályos négyzethálót, ahogy a 16.7. ábrán látható. A síkrészen a négyzetháló segítségével kijelölt felosztás azonos mé négyzeteit nevezzük a továbbiakban celláknak, magát a négyzetretu, egymást nem átfedo relációt pedig grid indexnek. hálót gridnek, az objektumokat a felosztás celláihoz rendelo Az indexelés során tároljuk, hogy az egyes síkbeli objektumok melyik cellába esnek. fontosságú muAz objektumok koordináták szerinti gyors keresésének mint alapveto lépése az úgynevezett elso szurés, veletnek elso amikor jelölteket állítunk a lekérdezés objektumok halmazára. Az index objektum azonosítói segítségével befeltételeit kielégíto olvassuk ezt a jelölthalmazt, ami a teljes adatbázisnál várhatóan jóval kevesebb objektumot tartalmaz. A jelöltállításhoz felhasználjuk, hogy a koordinátákra vonatkozó feltételekbol cellák, valamint hogy a grid index a cella azonogyorsan meghatározhatók a szóba jöheto formában tárolható. A grid index gyors sítója szerint rendezett, ezáltal gyorsan keresheto
690
16. Térinformatika
cella azonosító
7 22 34 34
objektum azonosító
objektum azonosító
B C F E
A B C D E F
egyéb attribútumok
. ..
. ..
. ..
. ..
tartalmazó tábla. 16.8. ábra. Az index tábla és az objektumok jellemzoit
kereséséhez felhasználhatunk a cella azonosítójára vonatkozó hagyományos adatbázis indexeket is. Második lépésben egy második szuréssel dolgozzuk fel az így megtalált objektumok részletes geometriáját (például poligonok esetén a csúcsok koordinátáinak beolvasása itt történik), és ellenorizzük a keresési feltételek teljesülését. A 16.8. ábra az index tábla felépítését szemlélteti a 16.7. ábra példáján keresztül. Az egyszeruség kedvéért csak azokkal az objektumokkal foglalkozunk, melyek csak egy cellához tartoznak, így elkerülve az objektum reprezentálásának problémáját. A grid index táblája a cella azonosítója alapján, az objektumokat tartalmazó tábla pedig az objektum azonosítója alapján gyorsan keresheto. szurés Ennél fogva az objektumok koordináták szerinti keresései során az elso gyorsan végrehajtható, valamint a második szuréshez szükséges jelöltek várhatóan jóval kisebb az objektumok táblájában. Ezzel szemben egy számosságú halmaza is gyorsan elérheto hasonló keresés az index tábla használata nélkül az objektumokat tartalmazó tábla teljes végigolvasását igényli, mivel a koordinátákra tett feltételek teljesülése csak az objektumok attribútumainak egyenkénti feldolgozásával döntheto el. megfelelo a cellák mérete nem mindig van összhangban az Amint a 16.7. ábrán meggyelheto, objektum méretével. Ha túl nagyok a cellák, akkor túl sok objektum esik egy adott cellába, ami szélsoséges esetben nem gyorsít a keresésen. Ha túl kicsik a cellák, akkor a nagyobb objektumok túl sok cellát fednek le, ami szintén nem elonyös. A probléma megoldható több, rácsállandójú grid-szint bevezetésével. eltéro A grid index egyszeru és hatékony módja a térbeli indexelésnek. Számos kereskedelmi szoftver alkalmazza is, annak ellenére, hogy hiányosságai nyilvánvalók, különösen olyan esetekben, amikor az objektumok térbeli eloszlása nem egyenletes. Az volna ugyanis a kívánatos, hogy lehetoleg minden cellába azonos számú objektum essen, ami az állandó Az objektumok inhomogén térbeli rácsméret miatt nagyon kis valószínuséggel fordul elo. eloszlása esetén a második szurési fázis hatékonysága erosen lecsökkenhet, ezért összetettebb és rugalmasabb indexelési algoritmusok használata is szükségessé válhat.
16.2.2. Négy-fa A négy-fa egy hierarchikus adatszerkezet, amely az oszd-meg-és-uralkodj elvhez hasonló rekurzív felbontás elvén alapszik. A sokféle négy-fa változatból mi most az úgynevezett pont-tartomány négy-fát vázoljuk fel. Az indexelés alapja az adott síktartomány rekurzív felosztása négy síknegyedre (16.9. ábra).
691
16.2. Térbeli indexelés
16.9. ábra. A rekurzív térfelosztás.
Az indexeléshez használt struktúra egy olyan fa szerkezetként ábrázolható, melynek csúcsa egy-egy síktartományt reprezentál, leveleiben pedig az objektumok minden belso csúcs tartalhelyezkednek el. A fa gyökere megfelel a kezdeti tartománynak. Minden belso mazza saját felosztásának középpontját, valamint négy mutatót a felosztás után keletkezo csúcsokra (jelölje ezeket az égtájak angol rövidítéseinek négy új tartománynak megfelelo mezo megfeleloen NW, NE, SE és SW ). Ha egy csúcs levél, akkor a csúcs egy ezt jelzo jét igazra állítjuk. A levelek vagy üresek ezt egy külön mezoben feljegyezzük , vagy pedig egy objektumot tartalmaznak, koordinátáival és egyéb attribútumaival, vagy ezt kiváltandó egy mutatót az objektum adatbázisbeli reprezentációjára. A levelek NW, NE, SE deniálatlanok. Megjegyzendo, hogy a belso csúcsok felosztást reprezentáló és SW mezoi pontját csúcsonként tárolni nem feltétlenül szükséges. Mivel a felosztás mindig egyértelmu, megvalósításával a felosztásra vonatkozó információk táezért a fa muveleteinek megfelelo A 16.10. ábra egy hét objektumot tartalmazó négy-fát rolása a csomópontokban elkerülheto. szemléltet, feltüntetve az objektumok koordinátáit. A fa felépítése az objektumok egyenkénti beszúrását jelenti. Ehhez elindulunk a fa gyö és egészen addig haladunk lefelé, amíg levélbe nem érkezünk. A bejárás során a kerétol, beszúrandó objektumot reprezentáló pont koordinátái alapján választjuk ki az adott csomó gyerekét. Ha levélbe érkeztünk és az üres, beszúrjuk az új pontot. Ha a levél pont megfelelo már tartalmaz egy objektumot, akkor az aktuális tartományt újra és újra fel kell osztanunk, egészen addig, amíg a régi és új csúcs már nem esik azonos tartományba. Ez a felosztás sok új altartomány létrehozását is jelentheti, ha a régi és új pontok távolsága kicsi. A felosztásokat megszüntethetjük pontok törlésekor. Ha egy pont törlésével az adott tartomány már csak egy pontot tartalmaz, akkor az altartományai összevonhatók. Nézzük meg, hogyan valósítható meg egy olyan keresés, amely a négy-fában repre objektumokat állítja elo. A N´ zentált, viewportba eso -- algoritmus adott (x1 , y1 )
< x2 és < y2 , valamint feltesszük, hogy a viewport a reprezentált síkrészbe esik. A keresés során
objektumokat adja vissza, ahol x1 és (x2 , y2 ) pontokkal deniált viewportba eso y1
sorrendben bejárjuk azokat a csúcsokat, melyek tartalegy mélységi bejárásnak megfelelo objektumot. Az eljárás megkapja az épp aktuális csúcsot (n pamazhatnak a viewportba eso
692
16. Térinformatika
(100, 100)
(0, 100) (6, 90)
(6, 90)
(88, 56)
(88, 56) (54, 46) (65, 36)
(85, 28)
(14, 4)
(72, 34) (85, 28)
(54,46)
(14,4) (100, 0)
(0, 0)
(65, 36) (72, 34)
16.10. ábra. Hét objektumot tartalmazó pont-tartomány négy-fa.
raméter), valamint a viewport koordinátáit. Az n csúcs koordinátáit koordX[n] és koordY [n], levél tulajdonságát levél[n], üres voltát üres[n], az általa reprezentált felosztás középpont tartalmazzák. A teljes fában jának koordinátáit pedig felosztásX[n] és felosztásY [n] mezok való kereséshez a fa gyökerével kell elindítani az algoritmust. N´ --(n, x1 , y1 , x2 , y2 ) 1 2
if levél[n]
4
else if if
7 8
if
9 10 11
¬ üres[n] ∧
x1
then return n
5 6
≤ koordX[n] ≤ x2 ∧ y1 ≤ koordY [n] ≤ y2 B Megtaláltunk egy viewporton belüli objektumot. felosztásX[n] > x1 ∧ felosztásY [n] < y1 B Gyerekek rekurzív bejárása. then N´ --(NW [n], x1 , y1 , x2 , y2 ) felosztásX[n] < x2 ∧ felosztásY [n] < y1 then N´ --(NE[n], x1 , y1 , x2 , y2 ) felosztásX[n] < x2 ∧ felosztásY [n] > y2 then N´ --(SE[n], x1 , y1 , x2 , y2 ) felosztásX[n] > x1 ∧ felosztásY [n] > y2 then N´ --(SW [n], x1 , y1 , x2 , y2 )
then if
3
if
A fa mérete és alakja fontos a keresés, beszúrás és törlés muveletek hatékonyságának szempontjából. A pont-tartomány négy-fa szerkezete a x térfelosztás miatt független a alakja és mérete viszont függ a beszúrt objektumoktól. A fa mubeszúrások sorrendjétol, függ. A fa minimális mélysége M obveleteinek futásideje alapvetoen a fa mélységétol jektum esetén
dlog4 (M − 1)e,
ekkor minden objektum azonos szinten helyezkedik el, a fa
kiegyensúlyozott. A fa azonban általában nem rendelkezik ezzel a hasznos tulajdonsággal, felso korlátot sem tudunk adni mélységére az függ ugyanis az objektumok páronkénti sot távolságától. Ahhoz ugyanis, hogy a fába beszúrjunk két pontot, mindenképp fel kell építenünk a fát legalább olyan mélységben, hogy a két pont közé essen egy tartomány-határ. Minél kisebb viszont a pontok távolsága, várhatóan ez annál késobb (annál mélyebb fát felépítve) következik be. Ha feltesszük, hogy az objektum-halmazunkban két pont távolsága
693
16.2. Térbeli indexelés
16.11. ábra. Négy-fa és a poligonok befoglaló négyszögei.
legalább d , valamint a tartományunk kiterjedése kezdetben r, akkor a fa mélységére adható egy
dlog2 (
√
2(r /d))e korlát. Legrosszabb esetben ugyanis egy d hosszú szakasz valamely
vetülete d / koordináta-tengelyre eso
√
legfeljebb r /(d / 2 hosszú, amibol
√
2) darab illeszt-
egy r hosszú szakaszra. heto Indexeléshez célszeru lehet egy olyan négy-fa változat használata, ahol a tartományok felosztásának feltételét a blokkmérethez igazítjuk, azaz csak akkor osztjuk tovább az adott pontok tárolásához szükséges lemezterület túlcsordul a blokk síkrészt, ha a síkrészbe eso méretén. A fa ezen változatában a levelek nem egy-egy objektumot, hanem objektumok halmazát tartalmazzák, melyeket azonos blokkban tárolunk. Poligonok esetére a helyzet nem olyan egyszeru, mint pontokra. A poligon összetett objektum, amelyet számos pont alkot. A poligonok indexeléséhez felhasználjuk a centroid objektum alkalmas arra, hogy vavagy a befoglaló négyszög fogalmát. Mindkét helyettesíto besoroláshoz megfeleloen lamely térnegyedbe történo reprezentálja a poligont. A centroid egy és csak egy térnegyedbe való besorolást enged meg, míg a befoglaló négyszög alkalmazásával egy-egy objektum több térnegyedbe is eshet, amint az a 16.11. ábrán látható. adatokra vizsgáltuk a négy-fa algoritAz eddigi példákban vektoros modellt követo must. A módszer raszteres adatmodellre is jól alkalmazható, mivel az adatok térbeli eloszlása teljes mértékben egyenletes, tekintettel a raszteres modell természetére. Raszteres adatmodell esetében célszeru lehet az úgynevezett tartomány négy-fák használata. Ezek felépítése hasonló, mint a pont-tartomány négy-fáké, csak a levelek az adott al-tartomány egészére vonatkozó információkat tárolnak. Ez a fa jól használható például képek tömörítésére: végezzük a felosztást addig, amíg az al-tartomány homogén területet nem reprezentál, ekkor a tartomány intenzitását tároljuk a levelekben.
694
16. Térinformatika
16.12. ábra. A nyolc-fa térfelosztása.
16.2.3. Nyolc-fa A négy-fa háromdimenziós kiterjesztése a nyolc-fa. Speciális esetekben használatos, mint például háromdimenziós objektumok (geológiai képzodmények, földalatti olajtárolók stb.) leírására. A 16.12. ábra a nyolc-fa térfelosztását szemlélteti. Osszuk a teret nyolc tértartományra, majd minden tartományt további nyolcra egészen térnyolcadban már csak egyetlen pont van. A négy-fa addig, amíg a fa adott szintjén lévo mintájára megalkotható egy olyan fa, amely segítségével az adott objektum attribútumaival együtt gyorsan azonosítható. A 16.12. ábra tartományait egy egyértelmu rendezés szerint megszámoztuk. Ezen és ha sonló rendezések célja az, hogy háromdimenziós tértartományok (vagy az oket reprezentáló Ezzel lehetové pontok) egy egyértelmu sorrendjét állítsuk elo. válik, hogy a tértartományo kat vagy általánosabban tetszoleges térbeli objektumhalmazt egydimenziós térbe képezzünk le, ahol már használhatjuk a hagyományos, elterjedt indexelési technikákat, például a B-fát. A legismertebb eljárás olyan térbeli görbe eloállítására, amely egyszer érinti a tér minden objektumát, az úgynevezett Peano rendezésen alapszik. Lényege, hogy összefésüljük az adott pont kettes számrendszerben felírt koordinátáit valamely rögzített sorrendben (pél bitje, y elso bitje, z elso bitje, x második bitje és így tovább). A pontokhoz így dául x elso sorrendet használva oldjuk meg a tér pontjainak bejárását, rendelt értékek szerinti növekvo rendezését.
Gyakorlatok
négy-fát egy (60, 38) és egy (67, 30) koordinátájú 16.2-1. Bovítsük a 16.10. ábrán szereplo
objektummal. 16.2-2. Lássuk be, hogy adott koordinátájú pont keresése a négy-fában O(h) idoben megoldható, ahol h a fa mélysége.
16.3. Digitális sz¶rési eljárások A térinformatika egy másik fontos területe a digitális képek, urfotók feldolgozása. A képi szoftverek számos képfeldolgozó, szur algoritmuson alapuló eljárást taradatokat kezelo o
695
16.3. Digitális szurési eljárások
16.13. ábra. Az RGB színkocka.
talmaznak. Ezen eljárások közül mutatunk be néhány fontosabbat, mint például alul- és fel o, éldetektáló szur ülvágó szur ok, élmegorz ok. A digitális képek feldolgozása során számos hatást, szurési eljárásnak vetjük alá a képeket annak érdekében, hogy számunkra kedvezo változást érjünk el. Felhasználási céljainktól függoen lehetséges, hogy szeretnénk eltüntetni a nagyfrekvenciás változásokat, vagyis simító szurést a képekrol hajtunk végre, vagy szeretnénk kiemelni a képen látható éleket. Az eljárások megértéséhez át kell tekintenünk néhány alapfogalmat.
16.3.1. Az RGB színmodell A számítástechnika fejlodésével lehetové vált, hogy a szemünk színlátó képességét meghaladó számú színt legyünk képesek ábrázolni. Amióta létezik a 24 bites színmodell, valósághunek látszanak a digitális képek. Legyen három koordináta tengelyünk, amely a három alapszínt szimbolizálja, RGB: Red (vörös), Green (zöld) és Blue (kék). E három szín intenzitását ábrázoljuk 0255 között. A teljesen sötét zöld (vagyis fekete) legyen 0, a teljesen világos pedig 255, valamint a többi két alapszínre is ugyanígy járjunk el. Az abszolút fekete pontban (Black) mindhárom alapszín intenzitás értéke 0, míg az abszolút fehér pontban (White) 255. A 24 bites színmodellt szemlélteti az 16.13. ábra. Bármely szín eloállítható e módon: három alapszín kombinációjából, a következo colour
= a · Red + b · Green + c · Blue ,
ahol a, b, c az egyes alapszínek intenzitása. Egy-egy alapszín intenzitása tehát 256 féle értéket vehet fel, így 256 féle zöld árnya latból, 256 féle vörös árnyalatból és 256 féle kék árnyalatból állítható össze egy tetszoleges szín, vagyis összesen 256 · 256 · 256 szín ábrázolható. Mivel 256
= 28 , így 28 · 28 · 28 = 224
féle színárnyalatot tudunk eloállítani. A 16.14. ábrán a NASA egy LANDSAT muholdja által készített kép három RGB sávjának intenzitásait és az azokból képzett színes képet lát hatjuk. Az eroforrás kutató muholdak frekvencia sávokban érzékelnek, amelyek nemcsak a látható tartományt fogják át, hanem gyakran infravörös sávokat is. Így az RGB színkocka több dimenziós is lehet, mint három. Az RGB színkocka mintájára a látható színeket más sávokkal is (pl. infravörös sávok) helyettesíthetjük, így hamis színes képeket állíthatunk elo. különVezessük még be a térbeli frekvencia fogalmát, amely az egységnyi távolságra eso intenzitás értékek számát méri. A 16.15. ábra a térbeli frekvencia fogalmát szemlélteti. bözo
696
16. Térinformatika
16.14. ábra. Egy LANDSAT muhold felvétele: az RGB sávok és a sávokból összeállított kép. Az ábra színes változata az 812. oldalon látható.
16.15. ábra. A térbeli frekvencia szemléletes jelentése.
16.16. ábra. Egy kép intenzitás értékeinek eloszlása (hisztogramja).
16.3.2. Hisztogram kiegyenlítés módszerek és a környezeti körülmények miatt a digitális képek intenA digitális leképezo zitásának dinamika tartománya kisebb, mint a lehetséges, vagyis a kép legsötétebb pontja általában világosabb, mint az abszolút fekete pont, valamint a legvilágosabb pontja sötétebb, mint az abszolút fehér pont, ahogy az a 16.16. ábrán látható. Toljuk el a kép legsötétebb pontjának intenzitását az abszolút fekete pontba, a legvilágosabb pont intenzitását az abszolút fehér pontba, és az összes többi pont intenzitás ezzel arányosan változtassuk meg. Ezzel megnöveltük a pixelek közti intenzitás különbséget, ezáltal kontrasztosabbá tettük a képet. Tekintsünk egy valós esetet, mégpedig a 16.17. ábrát, mely egy francia SPOT muhold által készített kép. A kép hisztogramját a 16.18. ábra mutatja. Amint látható elég keskeny sávban mozognak a kép intenzitás értékei, ezért is találjuk a képet kicsit túl szürkének. Vé transzformációt, amelynek az eredményét a 16.19. ábra mutatja. gezzük el a kontrasztnövelo
697
16.3. Digitális szurési eljárások
16.17. ábra. Az eredeti SPOT felvétel.
16.18. ábra. A SPOT kép intenzitás eloszlása.
16.3.3. Fourier-transzformáció A Fourier-transzformációt számos mu részletesen tárgyalja, tehát csak érintolegesen mutat nem periodikus függvénye. Írjuk juk be a legfontosabb összefüggéseket. Legyen s(t) az ido kifejezést: fel a következo
Z S(f)
∞
=
−2πi f t
s(t)e
dt
,
−∞ ahol S ( f ) az s(t) függvény Fourier-transzformáltja, vagyis a frekvencia tartománybeli
√
−1. S ( f )-t gyakran nevezik s(t) spektrumának is, az elképe, f a frekvencia és i = járást pedig Fourier-transzformációnak.
698
16. Térinformatika
16.19. ábra. A hisztogram kiegyenlítéssel megnövelt kontrasztú kép. Az ábra színes változata az 813. oldalon látható.
kifejezést, amelyet inverz Fourier-transzformációnak is neveznek: Írjuk fel a következo
Z
s(t)
∞
=
2πi f t
S ( f )e
dt
.
−∞ A Fourier-transzformált létezésének elégséges feltétele, hogy s(t) függvény szakaszonként sima (vagyis deriváltja véges számú hely kivételével folytonos), valamint az
Z
∞
| s(t)|dt −∞ kifejezés konvergens legyen. Ebben az esetben az S ( f ) Fourier-transzformált meghatározható.
16.3.4. Néhány speciális függvény Fourier-transzformáltja A szurési eljárások bemutatásakor szükségünk lesz néhány speciális függvény Fouriertranszformáltjára. Az egyik ilyen kiemelten fontos függvény a négyszög függvény. Négyszögimpulzus Számunkra az úgynevezett tranziens függvények érdekesek, vagyis amelyek nem periodikusak, hanem véges hosszúságú intervallumon különböznek a nullától. Vizsgáljuk meg néhány tranziens függvény Fourier-transzformáltját. Az egyik fontos függvény a négyszö gimpulzus (16.20. ábra), amely a következo:
( s(t)
=
a,
ha |t|
0
egyébként .
< τ/2 ,
699
16.3. Digitális szurési eljárások
16.20. ábra. A négyszögimpulzus.
16.21. ábra. A négyszög impulzus Fourier-transzformáltja a sinc függvény.
Végezzük el a függvény Fourier-transzformációját:
Z S(f)
Z
∞
=
s(t)e
−2πi f t
dt
τ/2
=a
−∞
−2πi f t
e
−τ/2
dt
= aτ
sin π f τ
πfτ
.
Ezt a függvényt szinusz kardinálisz függvénynek is nevezik és sinc-vel jelölik (16.21. hogy egy frekvencia tartománybeli négyszög függvény Fourierábra). Kézenfekvo, tartománybeli sinc függvény lesz. Ennek a ténynek nagy jelentosége transzformáltja az ido megvalósításakor. lesz az ideális felülvágó szur o Nézzük meg most azt a speciális esetet, amikor a négyszög egységnyi területu, vagyis aτ
= 1, vagyis a = 1/τ. Ez szavakban kifejezve annyit jelent, hogy minél keskenyebb a jel,
annál magasabb lesz a négyszögimpulzus. Dirac-δ Paul Dirac vezette be a róla elnevezett
δ-t pontszeru objektumok leírására. Használata meg-
könnyíti a digitális adatrendszerek leírását számos vonatkozásban. Deníció szerint legyen
δ
egy olyan függvény (klasszikus értelemben nem az, hanem úgynevezett disztribúció),
melyre
δ(t) = 0 ha t , 0, és
Z
∞
δ(t)dt = 1 . −∞ A Dirac-δ szemléletes jelentése egy végtelenül keskeny, és végtelenül magas amplitúdójú impulzus, amelynek görbe alatti területe egységnyi. Számunkra azért fontos a
δ-val
való
700
16. Térinformatika
foglalkozás, mert számos olyan tulajdonsága van, amely a jelfeldolgozás szempontjából lényeges. A t
= t0
esetre alkalmazva a
δ-t, azt kapjuk, hogy δ(t − t0 ) = 0, ha t , t0 .
Lássuk egyik fontos tulajdonságát, amelyet kiválasztó tulajdonságnak nevezhetünk.
δ(t − t0 ) -val. Ekkor
Szorozzunk meg az f (t) függvényt a
δ(t − t0 ) f (t) = δ(t − t0 ) f (t0 ) , Z
mivel
∞ −∞
Ez a kiválasztási képesség, vagyis a
δ(t − t0 ) f (t)dt = δ(t0 ) az
f (t0 )
.
kiválasztotta a t0 -hoz tartozó f (t) függvénybol
értéket. A következokben vizsgáljuk meg egy Dirac-impulzus és egy Dirac-impulzus sorozat Fourier-transzformáltját. Jelölje F a Fourier-transzformációt, amely a deníciója alapján
Z F {δ(t)}
∞
=
δ(t)e−2πi f t = 1 .
−∞ Dirac-impulzus Fourier-transzformáltja pedig Nem az origóban lévo
Z F {δ(t
∞
− a)} =
δ(t − a)e−2πi f t = e−2πi f a ,
−∞ Euler óta tudjuk, hogy amirol
−2πi f a
e
= cos 2π f a − i sin 2π f a .
tartományban) Fourier-transzformáltja: Dirac-impulzus sorozat (az ido
∞ ∞ 1 X X δ (t − kτ) = F δ( f − k/τ) . τ k=−∞ k=−∞
16.3.5. Konvolúció Legyenek f1 és f2 folytonos függvények. Jelölje konvolúciójukat h
=
f1
∗
f2 , melyet a
kifejezés deniál: következo
Z h(t)
=
f1 (t)
∗
f2 (t)
∞
= −∞
f1 (τ) f2 (t
− τ)dτ .
tartományA 16.22. ábra grakusan szemlélteti két négyszög függvény konvolúcióját az ido ban. Vizsgáljuk meg egy konkrét esetet, ahol digitális jelekre alkalmazzuk az összefüggést: legyen h(t) a t-edik pillanatban az f1 és f2 függvények konvolúciója, amit úgy kapunk, hogy az f1 t-edik pillanatban felvett értékét összeszorzunk az f2 (t
− τ) -edik értékével, majd vé-
gigfutunk f2 egész intervallumán (ami valóságos esetekben véges intervallum, jelen esetben M) és összegezzük a szorzatokat (futó összegzés). A folyamatot a 16.23. ábra szemlélteti.
16.3. Digitális szurési eljárások
tartományban. 16.22. ábra. Két négyszög függvény konvolúciója az ido
16.23. ábra. A konvolúció szemléletes jelentése.
701
702
16. Térinformatika
Az eddigiekben csak egydimenziós függvényekkel foglalkoztunk. Könnyen általánosítható a konvolúció fogalma kétdimenziós függvényekre is, mint amilyen a digitális kép. A konvolúció tulajdonságai A következokben röviden összefoglaljuk a konvolúció fobb tulajdonságait, bizonyítás nélkül.
•
A konvolúció kommutatív: f (t)
•
.
∗ [g(t) ∗ h(t)] = [ f (t) ∗ g(t)] ∗ h(t) .
A konvolúció disztributív: f (t)
•
f (t)
A konvolúció asszociatív: f (t)
•
∗ g(t) = g(t) ∗
∗ [g(t) + h(t)] =
f (t)
∗ g(t) +
f (t)
∗ h(t) .
Szorzat Fourier-transzformáltja a tényezok spektrumainak konvolúciója. Jelölje F a Fourier-transzformációt. Ekkor F {g(t)h(t)}
= G( f ) ∗ H( f ) ,
ahol G( f ) és H( f ) a g(t) és h(t) függvények spektrumai.
•
Függvények konvolúciójának Fourier-transzformáltja a spektrumok szorzata: F {g(t)
∗ h(t)} = G( f )H( f ) ,
ahol G( f ) és H( f ) az g(t) és h(t) függvények spektrumai.
•
Konvolváljuk az f (t) függvényt egy Dirac-impulzussal. f (t)
∗ δ(t − t0 ) =
f (t
− t0 ) .
helyre. A Dirac-impulzus eltolja a függvényt a saját argumentumában szereplo
•
Szorzás végtelen Dirac-δ sorozattal:
∞ X g(t)
δ(t − kτ) =
k=−∞
∞ X
g(kτ)δ(t
− kτ) .
k=−∞
A végtelen Dirac-δ sorozattal szorozva csak a kτ helyeken felvett értékeket tartjuk meg, és ez éppen a mintavételezésnek felel meg.
703
16.3. Digitális szurési eljárások
16.3.6. Sz¶rési algoritmusok A digitális szurési módszerek egyik legfontosabb fogalma a kernel. Jelentése mag. A szurési tartományban dolgoznak, a kernellel konvolválják a szurend képet. eljárások, amikor az ido o A szurés hatása attól függ, hogy milyen függvény értékeit tesszük be a kernelbe, ami egy n
× n-es mátrix. Ha meg tudjuk adni, hogy milyen átviteli függvényt kívánunk megvalósí-
tani a frekvencia tartományban, akkor annak inverz Fourier-transzformálásával megkapjuk tartománybeli függvényt, amelyet megfeleloen az ido mintavételezve megkapjuk a szur oe szur gyütthatókat, vagyis a kernelbe töltendo oegyütthatókat. A digitális konvolúció tehát a tartoszurések végrehajtásának egyik lehetséges módja. Ebben az esetben a szurést az ido módon: mányban végezzük a következo
0
g (t)
= g(t) ∗ s(t) , 0
tartományban, g (t) a szurt ahol g(t) az eredeti adatrendszer az ido adatrendszer és s(t) a kernel. Egy
másik
lehetséges
megoldás,
hogy
a
szurend o
adatrendszert
Fourier-
transzformáljuk, majd a frekvencia tartományban végezzük el a szurést (a Fouriertranszformáltat megszorozzuk a kívánt hatást biztosító átviteli függvénnyel), majd az így kapott spektrumot inverz Fourier-transzformáljuk.
G( f )
0
G (f)
0 g (t)
= = =
F {g(t)}
, , ( f )} ,
G( f )S ( f ) F
−1
{G
0
ahol g(t) az eredeti adatrendszer, G( f ) az adatrendszer Fourier-transzformáltja, S ( f ) a kí-
0
0
vánt átviteli függvény, G ( f ) a szurt adatrendszer a frekvencia tartományban, g (t) a szurt tartományban, F a direkt, és F adatrendszer az ido
−1
az inverz Fourier-transzformációt szim-
bolizálja. A digitális Fourier-transzformáció gyors végrehajtásához létezik az úgynevezett gyors Fourier-transzformáció algoritmus (FFT), amely gyorsan képes elvégezni a transzfor esetén játszik kulcsmációt. A kernel megállapítása nemcsak a frekvencia szerinti szur ok o, élkiemelo fontosságú szerepet, hanem más egyéb esetekben is, mint például az élmegorz cél néha olyan, hogy nem adható meg egy egyszeru szur ok. Az elérendo átviteli függvénnyel a muvelet, hiszen pontról pontra változhat az algoritmus által eloírt tennivaló. oekben A K felvázolt szurési módszer egy lehetséges meg´ ´ algoritmus az eloz valósítása. Bemenetként megkap egy M
×M
méretu F képet és egy K
×K
méretu H kon-
volúciós mátrixot (kernelt), eredményként pedig visszaadja a G képet, amely az eredeti F kép konvolúciója a H kernellel. A képek, valamint a kernel pontjainak indexelését nullá az összeadás és szorzás muveletek val kezdjük. A képekrol értelmezhetoségének érdekében feltesszük, hogy szürkeárnyalatosak. A feldolgozás során az algoritmus illeszti a kernelt F kimeneti képpont kezdeti sarkába, majd meghatározza a kernel középpontjának megfelelo színét a kernel által lefedett képpontok súlyozott összegeként. Ezután elcsúsztatja a kernelt vízszintesen majd függolegesen egészen addig, amíg az összes lehetséges illesztés meg nem történt. A 16.24. ábra a feldolgozás folyamatát szemlélteti egy háromszor hármas erosen felnagyított kernellel.
704
16. Térinformatika
16.24. ábra. Az erosen felnagyított kernel mozgása a képen (LANDSAT képrészlet). Az ábra színes változata az 813. oldalon látható.
K ´ ´ (F, H, K, M)
←
1
N
2
for x
3 4 5 6 7
K
2
← 0 to M − K do for y ← 0 to M − K do for i ← 0 to K − 1 do for j ← 0 to K − 1 do G(x, y) ← G(x, y) + (H(i,
B Beállítjuk a normalizációs konstanst. B Sorra vesszük az eredeti kép pontjait.
j)F(x
B Sorra vesszük a kernel pontjait. + i, y + j))/N
return G
Figyeljük meg, hogy a kimeneti G kép tetszoleges (x, y) pontja nem esik egybe az eredeti F kép (x, y) pontjával. Ennek oka, hogy az eredeti kép határaira csak úgy tudjuk illesz tehát a muvelethez lelóg az eredeti képrol, szükséges környezet nem teljesen ismert. Ezt a problémát a K úgy ´ ´ algoritmus egyszeruen
teni a kernel középpontját, hogy az
kép nem tartalmazza az itt említett határpontooldja meg, hogy az eredményként keletkezo kat. Csak azon pontokhoz rendel pontot az eredmény képben, melyekre megfeleloen illeszt a konvolúciós mátrix. Egy másik lehetséges megoldás a hiányzó szomszédsági pontok heto pótlása valamilyen értékkel, például a határolópontok másolása az ismeretlen területre. értéket felAz N normalizációs konstans elméletileg tetszoleges (nullától különbözo) vehet, az algoritmus most a kernel pontjainak számával normalizál.
705
16.3. Digitális szurési eljárások
átviteli függvénye (Fourier-transzformáltja a sinc függvény). 16.25. ábra. A felülvágó szur o
16.26. ábra. A kétdimenziós sinc függvény, mint az ideális felülvágás kernel függvénye.
A feldolgozás során bejárjuk az eredeti M × M méretu F kép minden nem képhatáron pontját, melyek száma (M − K + 1) lévo
2
lefedett K
2
, mindig feldolgozva a K × K méretu H kernel által
darab pontot. Ezt gyelembe véve vagy megvizsgálva az egymásba ágyazott
ciklusokat a K ´ ´ algoritmus futási ideje O((M
− K + 1)2 K 2 ).
Felülvágó szur o amikor a frekvencia tartományban egy bizonyos felso Akkor használunk felülvágó szur ot, határfrekvenciánál ( f f ) nagyobb frekvenciákat 0-val szorzunk, és a nála kisebbeket 1-gyel. A 16.25. ábra mutatja az ideális felülvágás átviteli függvényét. Ami a frekvencia tartomány tartományban konvolúció. ban szorzás, az ido tudjuk, hogy Fourier-transzformáltja a sinc függvény. A 16.26. A négyszög függvényrol ábrán a kétdimenziós sinc-t láthatjuk, mint az ideális felülvágás kernel függvényét. A felülvágó algoritmus végrehajtásához a kernelbe betöltjük a kétdimenziós sinc függ vény megfeleloen mintavételezett értékeit, majd a fent leírt módon végrehajtjuk a digitális konvolúciót. Alulvágó szur o akkor alkalmazzuk, ha az alacsony frekvenciás jeleket el akarjuk tüntetni Az alulvágó szur ot Átviteli függvénye a 16.27. ábrán látható. a képrol. Ha alaposabban szemügyre vesszük az alulvágás és a felülvágás átviteli függvényét, akkor észrevehetjük, hogy S
f a(
f)
=
1
− S f f ( f ), vagyis az
fa alsó határfrekvenciájú alulvágó
határfrekvenciájú felülvágó szur átviteli függvényének átviteli függvényének és az f f felso o összege azonosan 1 (feltéve, hogy fa
=
következoen, határfrekf f ). Ebbol ha az f f felso
706
16. Térinformatika
16.27. ábra. Az ideális alulvágás átviteli függvénye.
átviteli függvénye. 16.28. ábra. Az ideális sávszur o
akkor az ugyanazon (alsó) venciájú felülvágóhoz tartozó sinc függvényt levonjuk 1-bol, szur határfrekvenciájú alulvágó szur o oegyütthatóit kapjuk meg. Jelölje F a direkt, F
−1
az inverz Fourier-transzformációt, melynek azonosságai alapján
felírható a következo: F ahol S
f a(
−1
{S f a ( f )} = F {1} − F −1 {S f a ( f )} = 1 − s f a (t) ,
átviteli függvénye, s f a (t) pedig az f ) az fa alsó határfrekvenciájú alulvágó szur o
átviteli függvény inverz Fourier-transzformáltja. Sávszur o egy olyan szur amely egy adott alsó határfrekvencia alatt és egy felso haA sávszur o o, tárfrekvencia felett nem enged át. Átviteli függvénye a 16.28. ábrán látható. Kerneljét úgy határfrekvenciához, majd az fa alsó határfrekkaphatjuk meg, hogy kiszámítjuk az f f felso venciához tartozó sinc függvényeket, és ezeket kivonjuk egymásból. szur Az fa és f f frekvenciák egymáshoz közelítésével nagyon keskeny sávot átengedo ot hozhatunk létre. Ha ezt alkalmazzuk, majd az eredményt az eredeti képadatokból kivonjuk, úgynevezett lyukszurést végzünk. o szur Élmegorz ok ok olyan speciális szur Az élmegorz ok, amelyek átviteli függvényei nem adhatók meg. Mu ködésük meglehetosen egyszeru algoritmus szerint történik. A kernelt mozgassuk végig a pixelek értékeit. Rendezzük nagyság szerint sorba képen, és töltsük fel az éppen alatta lévo a kernel elemeit, és a rendezett adatsor valamelyik elemét rendeljük hozzá a kernel szim pixelhez, amelynek ez lesz a szurt az metria középpontja alatt lévo értéke. Ezek a szur ok a medián szur úgynevezett rangszur ok. Az egyik legismertebb rangszur o o, amely a sorba elemének értékét rendeli a pixel szurt rendezett értékek sorban középso értékének.
707
16.3. Digitális szurési eljárások
16.29. ábra. Egy egydimenziós idofüggvény (szaggatott vonal) és medián-szurt változata (folytonos vonal).
A 16.29. ábrán egy idosorra alkalmaztuk a medián szur ot. hogy a fel- vagy lefutó éleken a szur nem változtatja meg az eredeti Jól meggyelheto, o adatokat, hiszen azok az éleken már eleve nagyság szerint rendezettek. Nem éleken azon ban eroteljesen simít. A simítás mértéke a kernel hosszától függ, annál jobban simít, minél hosszabb. A 16.30. ábrán egy LANDSAT képrészlet és medián-szurt változata látható. Éldetektorok Az éldetektálás különösen fontos szerepet játszik az alakfelismerésben, a raszteres térképek vektorossá alakításában. Az élek a képnek azon helyei, ahol az intenzitás megváltozása a legnagyobb. Eloször is döntsük el, hogy mennyire kinomult élek kimutatását szeretnénk. A legtöbbször érdemes simító vagy medián szurésnek alávetni a képet, hogy ne mutassunk ki minden apró, jelentéktelen élt. A simítás egyik ismert és egyszeru módja a kép és egy gσ (x)
= √
1
− x2
2πσ
e 2πσ2
Gauss-függvény konvolúciója. Legyen h az f és g függvények konvolúciója. Kimutatható, hogy h
= ( f ∗ g)0 =
f
∗ g0 ,
vagyis egy jel (jelöljük f -fel) Gauss-függvénnyel (g) való konvolúciójának a deriváltja
708
16. Térinformatika
16.30. ábra. A bal oldali kép az eredeti, míg a jobb oldali egy kilenc pontos (9
× 9 pixeles) medián-szurt kép. Az
ábra színes változata az 814. oldalon látható.
a jel és a Gauss-függvény deriváltjának a konvolúciójával. Ezek alapján az éldeegyenlo tektálás algoritmusa a következo.
0
É ´ ´ ( f, g )
0
1
konvolváljuk f -et g -vel
2
számítsuk ki h abszolút értékét
3
deniáljuk éleknek mindazokat a helyeket, ahol a h abszolút értéke meghalad egy elore meghatározott küszöb értéket Nem használtuk ki sehol a gondolatmenet során, hogy egy vagy kétdimenziós esettel
van-e dolgunk, így az éldetektálás fenti módja képek esetére is muköd oképes. Ez az eljárás a Canny-féle éldetektor. Sokféle éldetektáló kernel létezik még. Egy másik, ismert éldetektáló az emboss-szur szur o o. Kernelje (3
× 3-as méretu esetben) a következo: 1
0
0
0
0 0
0
0
−1 .
tulajdonsága, hogy az ÉNY-DK irány kitüntetett. Hatására a középponti kernel Feltun o alatti képpixel lenullázódik, ellenben a kitüntetett irányba eso két pixel közül az egyik mezo pixel saját értékével, a másik pixel pedig értékének ellentettjével esik latba. Ezzel a muve változások kiemelodnek, lettel az ÉNY-DK irányba eso minden más elnyomódik. Ha másik változások kapnak hangsúlyt. Az emboss irányt tüntetünk ki, akkor az abba az irányba eso szurés eredményét mutatja 16.31. ábra. Az éldetektálók egy másik, gyakran alkalmazott eljárása a Laplace-szurés. Hatása ha sonlít az emboss szur ohöz, de nem tüntet ki irányokat. Mindenféle irányú éleket kiemel,
709
16.3. Digitális szurési eljárások
16.31. ábra. A bal oldali kép az eredeti, a jobb oldali az emboss-szurt változat. Az ábra színes változata az 814. oldalon látható.
16.32. ábra. A bal oldali az eredeti kép, a jobb oldali a Laplace-szurt változata. Az ábra színes változata az 815. oldalon látható.
minden mást elnyom. Kernelje is érdekes.
−1 −2 −1
−2 12
−2
−1 −2 −1 .
Hatását egy szintetikus képen érzékeltetjük a 19.18. ábrán.
710
16. Térinformatika
16.33. ábra. A bal oldali az eredeti kép, a jobb oldali az emboss-szurt változata. Az ábra színes változata az 815. oldalon látható.
Érdekes összehasonlítani a kétféle éldetektor eredményét a szintetikus képre. A 19.19. ábrán a szintetikus képet és az emboss-szurt változatát láthatjuk.
Gyakorlatok kifejezés: 16.3-1. Bizonyítsuk be, hogy igaz a következo (f
∗ g)0 =
f
∗ g0 .
az ÉKDNy, a második 16.3-2. Készítsünk három olyan 3 × 3-as méretu kernelt, ahol az elso az ÉD, a harmadik a KNy irányú éleket emeli ki.
16.4. Mintavételezés jelentoség A szaktudományokban alapveto u az adatnyerés folyamata, amely a technika mai színvonalán digitális adatnyerést vagy mintavételezést jelent. Mintavételezéskor gyakran állítunk elo digitális adatokat, máskor eleve diszkrét, esetleg nem szabályoanalóg jelekbol mintavételi pontokban történik az adatnyerés. A mintavételezés folyamasan elhelyezkedo tának megértése nagy jelentoség u, mivel az adatokból levonható következtetések függhetnek a mintavételezés módjától. Képzeljük el a mintavételezést, mint egy kétállású kapcsoló berendezést, amely bekapcsolt állapotban rögzíti a mérendo paraméval szabályozott méro Más szavakkal azt is mondtert, kikapcsolt állapotban pedig mit sem tud a környezetérol. hatjuk, hogy két mintavételi (ido)pont között bármi történik is, arról nem fogunk tudomást berendezésünk ilyenkor kikapcsolt állapotban van. Belátható, hogy szerezni, mivel méro ha surítjük ez a fajta hiányosság csökkentheto, a mintavétel mintavételezési gyakoriságát, állapothoz vagyis csökkentjük az érzékelés nélkül töltött üzemmód részarányát a muköd o
711
16.4. Mintavételezés
16.34. ábra. A mintavételezés eredménye egy olyan impulzus sorozat, melynek tagjai az eredeti függvénynek a mintavételi helyen felvett értékei.
képest. Nevezzük mintavételi távolságnak a két érzékelés közötti intervallumot, amely, ha dimenziójú, de lehet távolság dimenziójú is, ha két minidosorokról van szó, akkor ido tavételi pont között térbeli távolságról van szó. A következokben vázlatosan áttekintjük a esemintavételezés legfontosabb törvényszeruségeit, egyenletes mintavételezést feltételezo tekben. Az egyszeruség kedvéért idosorokkal, vagyis egydimenziós problémákkal foglalkozunk, amik teljes mértékben általánosíthatók több dimenziós esetekre is, mint amilyen a digitális kép, vagy a háromdimenziós terepmodell.
16.4.1. Mintavételi tétel Legyen
τ
az úgynevezett mintavételi távolság. Ábrázoljuk a g(t) idofüggvényt és a min-
tavételezés eszközét, a Dirac-impulzusok sorozatát, majd a mintavételezés eredményét, a digitalizált idofüggvényt (16.34. ábra). A mintavételezés tehát nem más, mint a g(t) idofüggvény és a Dirac-impulzus sorozat szorzata:
∞ X g(t)
δ(t − kτ) =
k=−∞
∞ X
g(kτ)δ(t
− kτ) .
k=−∞
Vizsgáljuk meg az analóg és a mintavételezett függvény spektrumát. Jelöljük G( f )-fel az eredeti, és G d ( f )-fel a digitalizált függvény spektrumát. A Dirac-δ Fourier-transzformáltja és a konvolúció tételek felhasználásával felírható a mintavételezett függvény spektruma:
Gd ( f )
= G( f ) ∗
vagyis Gd ( f )
=
1
1
∞ X
τ k=−∞
∞ X
τ k=−∞
G( f
δ( f −
−
k
τ
)
k
τ
.
)
,
712
16. Térinformatika
Értelmezzük a kapott eredményt. A kifejezés jobb oldala szerint a digitalizált jel spektruma periodikus, ami azért érdekes, mert a periodikus függvények spektruma nem periodikus függvény, vagyis a mintavételezés az eredetileg nem periodikus spektrumot periodikussá teszi. A spektrumnak a
−1/2τ és 1/2τ közé eso részét a spektrum fo részének, az
fN
= 1/2τ
rész fN periódusértéket Nyquist-frekvenciának nevezzük. A spektrum többi részén a fo sal ismétlodik. A fenti formulákból világosan kiolvasható, hogy az analóg és a digitalizált függvény spektruma jelentosen eltérhet egymástól, ha az analóg függvény bármilyen frek határfrekvencia ( f f ), venciájú jeleket is tartalmazhat. Ha azonban létezik egy olyan felso (vagyis létezik a spektrumra felso haamelynél nagyobb frekvenciájú jel nem fordulhat elo határfrekvencia és a tárfrekvencia), akkor belátható, hogy a felso
τ mintavételi távolsággal
legnagyobb frekvencia között igaz a következo összefüggés: még átviheto ff
≤
fN
,
vagyis
τ≤
1 2 ff
.
(16.1)
legEz az összefüggés a mintavételi tétel. Jelentése, hogy mintavételezéskor a még átviheto nagyobb frekvenciához, f f -hez úgy kell megválasztanunk a
τ mintavételi távolságot, hogy
teljesüljön a 16.1. egyenlotlenség. Ha túl kicsire választjuk a mintavételi távolságot, akkor feleslegesen sur un mintavételezett adatrendszert kapunk, ha viszont túl nagyra, mellyel nem határfrekvencia szerinti áll fenn a 16.1. egyenlotlenség, akkor nem fog teljesülni az f f felso rész ismétlodése jelátvitel. Túlzottan ritka mintavételezéssel tehát felülvágást, és a fo miatt kisebb-nagyobb torzulást okozunk az adatrendszer spektrumán.
16.4.2. A mintavételi tétel néhány következménye Láthattuk, hogy bizonyos esetekben a digitalizálás (mintavételezés) adatvesztéssel járhat. Tekintsük át, hogy mikor nem vesztünk adatot. A megfeleloen mintavételezett digitális adat az eredeti analóg jel pontosan visszaállítható. (Akkor mondjuk megfeleloen rendszerbol mintavételezettnek az adatrendszert, ha teljesült a mintavételi tétel 16.1. egyenlotlensége.) o részben láthattuk, hogy a mintavételezés periodikussá teszi a spektrumot. Ha ponAz eloz tosan vissza kívánjuk állítani az eredeti analóg jelet a mintavételezett jel G d ( f ) spektrumá részein kívüli részeit, vagyis meg kell szoroznunk ból, akkor el kell tüntetnünk a spektrum fo G d ( f )-t egy olyan négyszög függvénnyel, amelynek magassága
τ, szélessége 1/τ. Így egy-
szeruen levágjuk a spektrum periodikus részeit, vagyis kiküszöböljük a mintavételezéssel belevitt periodicitást, azaz visszakapjuk az analóg jel spektrumát. Az ismertetett gondolat tartományban, ha a visszakapott spektrumot inverz menet akkor adja vissza a jelet az ido Fourier-transzformáljuk. Ismerve a konvolúció tulajdonságait és a négyszög függvény (inverz) Fourier-transzformáltját, belátható, hogy a
τ
magasságú és 1/τ szélességu négyszög
függvénnyel való szorzás a frekvenciatartományban a sinc függvénnyel való konvolúciót tartományban. Ez alapján a jel visszaállítása az ido tartományban a következo jelent az ido módon lehetséges:
∞ X
k=−∞
∞ X g(t)δ(t − kτ) sinc(t/τ) =
k=−∞
g(kτ)sinc(t/τ
− k) ,
713
16.4. Mintavételezés
argumentummal vett vagyis a visszaállított értékek a minták és a sinc függvény megfelelo értékeinek szorzata. Ez egyrészt azt jelenti, hogy az így visszakapott értékek pontosan azo nosak az egyes minták értékeivel, valamint az analóg függvény tetszoleges helyén felvett argumentummal megadott sinc függvéértékek eloállíthatók a mintáknak és a megfelelo nyértékek szorzatának összegzésével. Természetesen csak akkor igazak ezek a megállapítások, ha teljesült a mintavételi tétel 16.1. feltétele. Túl nagyra választott mintavételi távolság esetén az analóg jel spektruma nem állítható vissza pontosan, mivel a túl ritka mintavétel felülvágást hajtott végre a spektrumban.
16.4.3. Két tipikus mintavételi probléma A következokben bemutatunk két, a térinformatikában tipikus mintavételezési feladatot, elmondottak. melyek megoldása során jól használhatók a mintavételrol Digitális fénykép törA raszteres rendszerek tipikus adatnyerési módja a muholdakról vagy repülogépekr ol fényképezés. A bemutatott idofüggvényekhez téno képes ezekben az esetekben a mintavételezés kétdimenziós, mivel a mintavételezést egy kétdimenziós Dirac-δ sorozattal végezzük, amelynek mindkét irányban
τ a mintavételi távolsága, a minták értéke pedig az adott Dirac-
intenzitás és színérték. Mindez a gyakorlatban érzékelo kamerákkal impulzus felett lévo valósítható meg, amelyeknek
vannak. Ezen érzékelok mérete τ rácsállandójú fényérzékeloi
legnagyobb térbeli felbontó képességet, vagyis a fényképeken meghatározza az elérheto nem mutatható ki 2τ -nál kisebb részlet. Domborzati modellek A domborzati modellek megalkotásának egyik fontos állomása, hogy ismerjük szabályos rácspontokban a felszíni magasság értékeket. Ezen adatnyerési technikák ismertetését mel lozzük, ugyanakkor fontosnak tartjuk kiemelni a mintavételi tétel ide vonatkozó következményeit. A magasság értékek egy a felszínt leíró függvénynek egy
τ
rácsállandójú Dirac-
impulzus sorozattal való szorzásával kaphatók meg (19.20. ábra). A 16.36. ábrán egy valóságos domborzati modellt láthatunk, amelynek felbontóképessége körülbelül 5 méter, amivel a mintavételi tétel miatt 10 méternél kisebb horizontális kiterjedésu felszíni egyenetlenség nem mutatható ki. Ezért csak építészeti, várostervezési célú felhasználást enged meg. Ha például a felhoszakadások alkalmával lezúduló csapadékvíz lefolyását kívánnánk modellezni, akkor pontosabb (nagyobb felbontású) domborzati modellt kellene megalkotni. Általánosságban kimondható, hogy nincsenek univerzális, minden célra alkalmas dom mivolta egyben különbözo borzati modellek. A pontossággal szembeni elvárások eltéro hogy ami a telekommunikámintavételezési kritériumokat is jelent. Ezért fordulhat elo, ció számára megfeleloen pontos domborzati modell, az az árvízvédelem számára teljesen használhatatlan.
714
16. Térinformatika
16.35. ábra. A
τ rácsállandójú Dirac-δ sorozattal mintavételezett felszín.
16.36. ábra. Egy település domborzati modelljének perspektivikus megjelenítése északi irányból. Az ábra színes változata az 816. oldalon látható.
715
16. Feladatok
Gyakorlatok 16.4-1. Hogyan célszeru megválasztani a
τ mintavételi távolságot?
16.4-2. Elemezzük, hogy mit történik az adatrendszerrel és a spektrummal, ha teli távolságról áttérünk a
• •
τ2
τ1
mintavé-
mintavételi távolságra, abban az esetben, ha
τ1 < τ2 (ritkítás); τ1 > τ2 (surítés).
Feladatok 16-1. A négy-fa további muveletei oekben muveletét. Az eloz felvázoltuk a pont-tartomány négy-fa egy lekérdezo Készítsünk lekérdezésekhez: hatékony algoritmust objektum törléséhez a fából, valamint a következo
a.
határozzuk meg egy P pont legközelebbi szomszédját, azaz azon objektumot, melynek a legkisebb (NN-query), valamint távolsága P-tol
b.
határozzuk meg egy P pont legközelebbi k darab szomszédját, azaz a P-hez legközelebb k darab objektumot (k-NN query). fekvo
16-2. Konvolúció RGB színkódok esetében A színes képek pontjainak RGB kódjait a K ´ ´ algoritmus összeadást és szorzást használó muvelete nem megfeleloen kezeli. Készítsük fel az algoritmust a színes képek kezelésére. 16-3. Konvolúció kiterjesztése a teljes képre A K ´ ´ algoritmus a bemeneti kép azon pontjait, melyekre nem tudja illeszteni a kernel középpontját, eldobja. Készítsük el az algoritmus olyan változatát, amely ezen hatá rolópontokhoz is rendel képpontokat a kimeneti képben. Gyakorlatban gyakran eloforduló megoldásnak számít a kernel által lefedett területek tükrözése vagy másolása a kép szélén túli területre. Gondoljuk át a lehetséges megoldások elonyeit és hátrányait. 16-4. Zajszurés Mindhárom véletlen Tegyük fel, hogy van három képünk pontosan ugyanarról a területrol. zajjal fertozött. a.
Tegyünk több javaslatot a zaj csökkentésének módjára.
b.
Mi történik a képpel és a jel/zaj aránnyal, ha a három képet egyetlen képben összegezzük?
16-5. Csonkítás elemzése A sinc függvény, mint láthattuk, fontos szerepet játszik mind a szurések, mind pedig a mintavételezés területén. Ideális esetben a frekvenciatartományban megkívánt végtelenhez
716
16. Térinformatika
közeli levágási meredekség miatt a sinc függvénynek nagyon hosszúnak kellene lennie, mivel a sinc csak lassan tart nullához. Ezért a magfüggvény viszonylag hosszú lesz, ami viszont hátrányos az eljárás futási idejének szempontjából. Ezért a sinc függvény helyett annak csonkított változatát használják a gyakorlatban a szur ok, és az újra-mintavételezés végrehajtásakor. A csonkító függvények általában valamiféle
harang-görbék, amivel mó dosítják a sinc függvényt. A módosított súlyfüggvény az eredeti súlyfüggvény és a csonkító függvény szorzata. Bizonyítsuk be a konvolúció azonosságai segítségével, hogy a legrosszabb eredményt adja az a csonkítás, amikor egyszeruen elhagyjuk a magfüggvény széleit, vagyis ha a csonkító függvény a négyszög függvény.
Megjegyzések a fejezethez Laurini [279], valamint Maguire és társai [304] könyvei részletesen tárgyalják a különbözo térinformatikai adatmodelleket. A centroid és a befoglaló négyszög fogalmát is bevezetik, aminek jelentoségét [386] több helyen ki is fejti. Hatvany Csaba [195] és Stephens [438] grakus programozással foglalkozó muveikben részletesen foglalkoznak a grakus adatok és a megjelenítés kérdéseivel. Rigaux és társai [386] elméleti alapmuvükben részletesen foglalkoznak a térbeli indexelés problematikájával és összevetik a [90] tankönyvben is részletesen tárgyalt B-fa muködésével. [294] és [386] összehasonlítják a grid index és a rekurzív térfelosztási algoritmusok hatékonyságát. A négy-fa és más kapcsolódó adatszerkezetek részletes elemzésével foglalkozik Samet [410] cikke. [279], [294] és [386] részletesen tárgyalják a négy-fa algoritmust, valamint ugyanitt olvashatunk a nyolc-fáról is. Szintén meg nem esett szó a fejezetben, de a gyakorlatban található ezen muvekben az R-fa, melyrol a B-fához sokszor használt adatszerkezet. Az R-fa a befoglaló négyszög fogalmára építo, hasonló összetettebb keresofa, melyet tetszoleges dimenziószámú térben alkalmazhatunk. Hasznos tulajdonságai, hogy csúcsainak méretét az aktuális blokkmérethez igazíthatjuk, ki egyensúlyozott, valamint megfeleloen támogatja a gyakori lekérdezés-típusokat. A négy-fa és a nyolc-fa grakai alkalmazásával foglalkozik a 15.4. alfejezet. [195] és [438] a gyakorlati programozás oldaláról mutatják be az RGB színmodellt, algoritmust, mint például az alul- és és több, a digitális szurési technikában ismert szur o ok, Richards felülvágó szur ok, sávszur ok, élmegorz élkiemelok, és sok más érdekes szur ot. könyve [385] elméleti alapmu, amely szélesköru áttekintést nyújt az urfotók, a távérzékelés az észleléstol a feldolgozáson át az értelmezésig. Duncan muvéb [115] jó problémakörérol ol a Fourier-analízis. áttekintést kapunk a komplex függvénytanról, amely nélkül nem értheto formában vezeti be az Olvasót a disztribúcióelmélet fogalmaiba. Tárgyalja a [93] értheto Dirac-δ-t, a Heaviside-féle lépcsofüggvényt és sok más érdekességet, amely nélkül a jelfel [90], [321] és [322] részletesen isdolgozás és mintavételezés nehezen lenne megértheto. mertetik a Fourier-transzformációt, sok példával, alapos elméleti áttekintéssel. Meskó Attila szurési technikák, valamint tankönyveiben [321, 322] részletesen olvashatunk a különbözo ezek gyakorlati alkalmazásáa mintavételezés elméleti alapjairól, a mintavételi törvényrol, ról. Ákos és Szabó György [109, A térinformatikával foglalkozik magyar nyelven Detrekoi 110], Kertész Ádám [253], Márkus Béla [338], valamint Márton Mátyás és társai [340] könyve.
17. Tudományos számítások
A tudományos számítások cím egy kísérlet a nemzetközi szakirodalomban
Scientic Scientic Engineering, Computational Science and Engineering stb. névvel hivatkozott diszciplína magyar megnevezésére. Ezt a területet a matematika, Computing,
a szoftverek és az alkalmazási területek közti interdiszciplináris területként is szokás jellemezni. Célja a számítógépek és matematikai algoritmusok a hardvert is tekintetbe hatékony felhasználása tudományos és mérnöki problémák megoldására. A témakör vevo irodalmának tanulmányozása alapján némi egyszerusítéssel azt mondhatjuk, hogy témánk valójában a numerikus matematika, a szoftverfejlesztés, az eredmények grakus megjelenítése (számítógépes graka) és a szakterületi alkalmazási ismeretek együttese. A terjedelmi korlátokra és az ésszeruségre tekintettel csak a kérdéskör néhány alapvetoen fontos elemét tárgyaljuk, amelyek a lebegopontos aritmetika (17.1. alfejezet) és a hibae módszereire lemzés (17.2. alfejezet) alapjaira, a lineáris algebra (17.3. alfejezet) alapveto és a matematikai szoftverekre, szoftverkönyvtárakra (17.4. alfejezet) vonatkoznak.
17.1. Lebeg®pontos aritmetika és hibaelemzés 17.1.1. Hibaszámítási alapismeretek Legyen x a kiszámítandó pontos érték, a az x közelítése (a ≈ x). A közelítés hibáját a érték abszolút ∆a = x − a képlettel deniáljuk (néha fordított elojellel). A δa-t az a közelíto hibakorlátjának (vagy röviden csak hibakorlátjának) nevezzük, ha fennáll | x − a| = |∆a| ≤ √ δa. Például a 2 ≈ 1.41 közelítés hibája legfeljebb 0.01, más szóval egy hibakorlátja 0.01. Az x és az a mennyiségek (és természetesen a ∆a, δa is) vektorok vagy mátrixok is lehetnek. Ilyenkor az abszolútérték és a relációs jelek komponensenként (mátrixelemenként) értendok. A hiba nagyságának mérésére normát is használunk. Ez esetben a hibakorlát, ha fennáll
δa ∈ R akkor
k∆ak ≤ δa.
Az abszolút hibakorlát sok esetben semmitmondó. Például egy 0.05 abszolút hibakorlátú közelítés lehet egészen kiváló is, de egy 0.001 nagyságrendu elméleti mennyiség becs hibakorláttal lésénél nem sokat ér. A becslés jóságát sokszor a relatív, azaz az egységre eso jellemezzük, ami
δa/ | x| (vektorok, mátrixok esetén δa/ k xk). Mivel az x pontos érték általáδa/ |a|, (illetve a δa/ kak) közelítést használjuk. Az így elkövetett
ban nem ismeretes, ezért a
hiba elhanyagolható, ha x és a abszolút értéke (normája) lényegesen nagyobb a másodrendu 2
(δa) mennyiségnél. A relatív hibát sokszor százalékokban fejezzük ki. Minthogy a hibát rendszerint nem ismerjük, ezért hibán gyakran a hibakorlátot értjük. de ismert hiA klasszikus hibaszámítás alapmodelljében azt vizsgáljuk, hogy közelíto,
718
17. Tudományos számítások
bakorlátú bemeneti adatokkal pontosan végrehajtott számítások során mekkora a végeredmény hibakorlátja. Legyen x és y két pontos érték, a az x, b pedig az y közelítése. Tegyük fel, hogy az a és b közelítések abszolút hibakorlátai
δa,
ill.
δb.
A klasszikus hibaszámítás
hibakorlátokat kapjuk: eszközeivel a négy alapmuveletre a következo
( ) δ(a + b) δa δb (ab > 0) , δ (a + b) = δa + δb, = max , |a + b| |a| |b| δ(a − b) δa + δb (ab > 0) , = δ (a − b) = δa + δb, |a − b| |a − b| δ(ab) δa δb (ab , 0) , ≈ + δ (ab) ≈ |a| δb + |b| δa, |ab| |a| |b| δ(a/b) δa δb |a| δb + |b| δa (ab , 0) . δ(a/b) ≈ , ≈ + 2 |a/b| |a| |b| |b|
látható, hogy nullához közeli számmal való osztás során az abszolút hiba, A képletekbol míg nullához közeli végeredményu kivonás esetén a relatív hiba akármilyen naggyá válhat. Ezeket az eseteket kerülni kell. Különösen a kivonás lehet nagyon alattomos.
√ 17.1. példa. Számítsuk ki a
1996 −
√
√ 1995 mennyiséget, ha ismertek a
1996
≈ 44.67 és a
√ 1995
≈
értékek, amelyek közös abszolút hibakorlátja 0.01, a közös relatív hibakorlát pedig 44.66 közelíto 0.022%. A kivonás elvégzésével kapjuk, hogy az általános képletbol
√
1996 −
√
1995
≈ 0.01, amelynek relatív hibakorlátja
0.01
+ 0.01 =2, 0.01 azaz 200%. Most lehetoségünk van a tényleges relatív hiba kiszámolására is, ami
csak 10.66%. Ez 2 mértéku, a valóságos hiba is jelentos a kiinduló adatok hibájához képest kb. 4.84 × 10 -szoros. A különbség képzését elkerülhetjük a
√
√
− 1995 1 1 = √ ≈ ≈ 0.01119 √ √ 89 .33 1996 + 1995 1996 + 1995 abszolút hibája 0.02, a hányados relatív hibája pedig átalakítással. A számláló pontos érték. A nevezo 0.02/89.33 ≈ 0.00022 = 0.022%. Ez összhangban van a kiinduló adatok relatív hibáival és lényegesen 1996
−
1995
= √
1996
kisebb, mint amit a közvetlen kivonásnál kaptunk.
(elKétszer folytonosan differenciálható egy-, illetve többváltozós függvények közelíto fokú Taylor-polinomjuk segítségével kapjuk: sorend u) hibáit az elso
δ(f δ(f
≈ f 0 (a) δa, f : R → R , n X ∂ f (a) δai , f : Rn → R . (a)) ≈ ∂ xi (a))
i= 1
az úgynevezett kondíFüggvények adott a pontbeli numerikus stabilitására jellemzo függvényérték és a közelíto bemeneti mennyiség relatív hibájának ciószám. Ez a közelíto hányadosa (F :
Rn → Rm
0
esetén F (a)-n az F függvény a
∈ Rn
mátrixát értjük):
| f 0 (a)| |a| , | f (a)| kak kF 0 (a)k c(F, a) = , kF(a)k c( f , a)
=
f :
R→R,
F :
Rn → Rm .
helyen számított Jacobi-
719
17.1. Lebegopontos aritmetika és hibaelemzés
17.1. ábra. Direkt hiba és inverz hiba.
ennyiszeresre no a A kondíciószám tehát a relatív hiba nagyítási számának tekintheto: bemeneti relatív hiba a függvényérték kiszámítása során. Ennek megfeleloen a függvényünk numerikusan stabil, más néven jól kondicionált az a helyen, ha c( f , a) kicsi, egyébként Egy függvény numerikusan instabil (rosszul kondicionált). A kondicionáltság helyfüggo. lehet valamely a helyen jól, míg ugyanaz a függvény egy b helyen rosszul kondicionált. Természetesen a c( f , a)-ra vonatkozó
relatív. Mint késobb kicsi jelzo látni fogjuk, ez a re adott feladat esetén a rendelkezésre álló számítógép aritmetikájától és a közelítés latív jelzo megkövetelt pontosságától függ. korlátját vezethetjük Mátrixok kondíciószámát is mint függvény kondíciószám felso
Rn → Rn leképezést az Ay = x egyenletrendszer megoldásával, azaz legyen F(x) = ∈ Rn×n , det(A) , 0). Ekkor F 0 ≡ A−1 és
−1
kak
A−1
kAyk
A−1
(Ay = a) . c(F, a) = ≤ Ak A = k
A−1 a
kyk be. Deniáljuk az F :
−1 A x (A
korlátot az A mátrix kondíciószámának A jobboldali felso hívjuk. Ez a korlát pontos,
mert létezik olyan a
∈ Rn , hogy c(F, a) = kAk
A−1
.
17.1.2. Direkt és inverz hibák Vizsgáljuk egy f (x) függvényérték kiszámítását. Ha az y közelítést számoljuk a pontos
= f (x) érték helyett, akkor a direkt hiba ∆y = y − y. Ha egy x + ∆ x értékre fennáll, hogy = f (x + ∆ x), azaz y a perturbált (megváltoztatott) x = x + ∆ x értékhez tartozó pontos függvényérték, akkor a ∆ x értéket inverz hibának nevezzük. A kétfajta hibát mutatja a 17.1.
y y
ábra. A folytonos vonal az elméleti értéket, a szaggatott pedig a számított értéket jelöli. Az inverz hiba elemzését és becslését inverz hibaanalízisnek nevezzük. Ha több inverz hiba is létezik, akkor a legkisebb inverz hiba meghatározása az érdekes. Az y
=
f (x) értéket számító algoritmust inverz stabilnak nevezzük, ha bármely x ér-
tékre olyan y számított értéket ad, amelyre a
∆x
inverz hiba kicsi. A
zetfüggo.
környekicsi jelzo
A direkt és az inverz hiba kapcsolatát a hibaszámítási ökölszabálynak is nevezett
δy δ x ≤ c ( f , x) |y| | x| egyenlotlenség közelíto fejezi ki. Szavakban megfogalmazva: relatív direkt hiba
≤ kondíciószám × relatív inverz hiba.
(17.1)
720
17. Tudományos számítások
Az egyenlotlenség azt mutatja, hogy egy rosszul kondicionált probléma számított megoldásának nagy lehet a (relatív) direkt hibája. Egy algoritmust direkt stabilnak nevezünk, ha a direkt hiba kicsi. Egy direkt stabil módszer nem feltétlenül inverz stabil. Ha az inverz hiba és a kondíciószám kicsi, akkor az algoritmus direkt stabil.
= log x függvényt. Ennek kondíciószáma c ( f , x) = c (x) = 1/ log x , x ≈ 1 esetén nagy. Tehát az x ≈ 1 értékekre a relatív direkt hiba nagy lesz.
17.2. példa. Vizsgáljuk az f (x) amely
17.1.3. Kerekítési hibák és hatásuk a lebeg®pontos aritmetikában A hibaszámítás klasszikus felfogásában csak a bemeneti adatok hibáiból származó, úgynevezett öröklött hibákat vizsgáljuk. A digitális számítógépek a számokat véges sok számjeggyel ábrázolják, így egy F véges számhalmaz elemeivel hajtják végre az aritmetikai mu veleteket és ezek eredményeit is az F elemei közül kell kiválasztaniuk. Tehát már a bemeneti hibái is módosulnak az ábrázolásuk során, majd minden egyes muveadatok eleve meglévo let eredménye további torzulást szenvedhet. Ha a muvelet eredménye az F halmazbeli szám, akkor a muvelet eredményét pontosan kapjuk meg. Egyébként pedig három eset léphet fel:
•
kerekítés ábrázolható (nemnulla) számhoz;
•
alulcsordulás (kerekítés 0-hoz);
•
túlcsordulás (ábrázolhatatlanul nagy abszolút értéku eredmény esetén).
A tudományos-muszaki számítások zömét ún. lebegopontos aritmetikában végezzük. Ennek legáltalánosabban elfogadott modellje a következo. 17.1. deníció (a lebegopontos számok halmaza).
F(β, t, L, U )
( = ± m × βe |
1
β
≤ m < 1,
m
= 0.d1 d2 . . . dt ,
L
) ≤ e ≤ U ∪ {0} ,
ahol
•
β a számrendszer alapja;
•
m a lebegopontos szám mantisszája a
•
e az ábrázolt szám kitevoje (karakterisztikája, exponense);
•
t a mantissza hossza (az aritmetika pontossága);
•
L a legkisebb kitevo (alulcsordulási határ kitevoje);
•
U a legnagyobb kitevo (túlcsordulási határ kitevoje).
β alapú számrendszerben;
A három leggyakrabban használt számrendszert táblázatban foglaltuk össze. elnevezés
β
felhasználás
bináris
2
legtöbb számítógép
decimális
10
legtöbb számológép
hexadecimális
16
IBM és hasonló nagyszámítógépek
(17.2)
721
17.1. Lebegopontos aritmetika és hibaelemzés
A mantisszát felírhatjuk az m
d1
= 0.d1 d2 . . . dt =
β
+
d2
+ ··· +
β2
dt
(17.3)
βt
alakban is. Innen látható, hogy az 1/β
≤ m < 1 feltétel miatt az elso jegyre teljesülnie ≤ β − 1 egyenlotlenségnek. A többi számjegyre fennáll, hogy 0 ≤ di ≤ β − 1 (i = 2, . . . , t). Az ilyen számrendszereket normalizáltaknak nevezzük. A 0 jegyet és jegy csak az a tizedespontot értelemszeruen nem szokás ábrázolni. Ha β = 2, akkor az elso 1 lehet, amelyet szintén nem ábrázolnak. A (17.3) felírást használva az F = F(β, t, L, U ) ≤
kell az 1
d1
halmazt megadhatjuk az
F
alakban is, ahol 0 17.3. példa. A
( = ±
d1
β
+
d2
β2
+ ··· +
dt
! βe |
βt
L
) ≤ e ≤ U ∪ {0}
(17.4)
≤ di ≤ β − 1 (i = 1, . . . , t) és 1 ≤ d1 .
β = 2, t = 3, L = −1 és U = 2 esetén a 33 elemu F halmaz pozitív része ( ) 1 5 6 7 1 5 6 7 10 12 14 20 28 . , , , , , , , , 1, , , , 2, , 3, 4
16
16
16
2
8
8
8
8
8
8
8
8
Az F halmaz elemei nem egyenletesen helyezkednek el a számegyenesen. Az 1/β, 1 F-beli szomszédos számok távolsága intervallumba eso a
±m × β
e
β−t . Minthogy az F halmaz elemeit
számok alkotják, a szomszédos F-beli számok távolsága az exponens értékének
megfeleloen változik. A szomszédos elemek legnagyobb távolsága
β
L −t
. A
β alapú számrendszerben m ∈ 1
β
≤m=
d1
β
+
d2
β
2
+ ··· +
1/β, 1
dt
β
t
≤
βU −t , a legkisebb pedig
− 1/βt , ugyanis
β−1 β−1 β−1 1 + 2 + ··· + =1− t . t β β β β
Fenti összefüggés segítségével könnyen igazolható az ábrázolható számok nagyság következo tétel. rendjét jellemzo 17.2. tétel. Ha a
∈
F, a
, 0, akkor ML
Legyen a, b
∈
F és jelölje
ML
≤ |a| ≤
= β L −1 ,
MU
MU , ahol
= βU (1 − β−t ) .
a négy aritmetikai muvelet (+, −, ∗, /) bármelyikét. A
esetek lehetségesek: következo (1) ab (2) (3) (4)
∈ F (pontos eredmény), |ab| > MU (aritmetikai túlcsordulás), 0 < |ab| < ML (aritmetikai alulcsordulás), ab < F, ML < |ab| < MU (nem ábrázolható eredmény).
Az utolsó két esetben a lebegopontos aritmetika az ab eredményhez hozzárendeli a egyforlegközelebbi F-beli számot. Ha két szomszédos F-beli szám az ab eredménytol mán távol van, akkor általában a nagyobbik számhoz kerekítünk. Például ötjegyu decimális
722
17. Tudományos számítások
aritmetika esetén a 2.6457513 számot a 2.6458 számhoz kerekítjük. Legyen G
= [− Mu , Mu ].
| x − (x)|
⊂
Világos, hogy F
→
rendelt F-beli számot jelölje (x). Az x
G. Legyen x
∈
G. A kerekítéssel x-hez
(x) leképezést kerekítésnek nevezzük, az
mennyiséget pedig kerekítési hibának. Világos, hogy ha (x)
rekítési hiba legfeljebb
β1−t /2.
= β1−t /2
Ezért az u
=
1, akkor a ke-
mennyiséget az egységnyi kerekítés
mértékének nevezzük. Az u az (x) relatív hibakorlátja. Igaz ugyanis a 17.3. tétel. Ha x
∈ G, akkor (x)
=
x(1
+ ε),
|ε| ≤ u .
Bizonyítás. Az általánosság megszorítása nélkül feltehetjük, hogy x
>
0. Legyen az x szá-
mot közrefogó két szomszédos F-beli szám m1 β és m2 β . Ekkor tehát e
m1 β
m2
− m1
≤
x
≤ m2 βe ,
− β−t = m1 < m2 = 1 fennáll. Minthogy = β mindkét esetben teljesül, akár az (x) = m1 βe , akár az (x) = m2 βe kerekítés
és vagy 1/β
≤
−t
m1
<
m2
≤
1
− β−t ,
e
e
vagy 1
következik be, igaz, hogy
| (x) − x| ≤
|m2 − m1 | 2
βe =
βe−t 2
.
következik Ebbol
βe−t β− t | (x) − x| | (x) − x| ≤ ≤ = ≤ m1 βe 2m1 βe 2m1 | x| Fennáll tehát, hogy (x)
2
β1−t = u .
− x = λ xu, ahol |λ| ≤ 1. Ezt átrendezve kapjuk, hogy (x)
Mivel
1
=
x(1
+ λu) .
|λu| ≤ u, az ε = λu jelöléssel megkaptuk a tétel állítását.
A tétel tulajdonképpen azt mondja ki, hogy a lebegopontos aritmetikában a kerekítés relatív hibája korlátos és ez a korlát u, az egységnyi kerekítés mértéke. A kerekítés pontosságának jellemzésére az u kétszeresét szokás használni. Az 2u
= β1−t
értéket szokás gépi epszilonnak is nevezni. Az
M
M =
az 1 és a hozzá legközelebbi
algoritmussal határozhatjuk 1-nél nagyobb szám távolsága. Bináris alap esetén a következo meg
M
értékét.
G´ -
←1
1
x
2
while 1
3 4 5
+x>1 ← x/2
do x
M ← 2x return M
723
17.1. Lebegopontos aritmetika és hibaelemzés
M ≈ 2.2204 × 10−16 .
A MATLAB rendszerben
feltevésA lebegopontos aritmetikai muveletek eredményére vonatkozóan a következo sel élünk (szabvány modell): (ab)
= (ab) (1 + ε) ,
|ε| ≤ u
(a, b
∈
F)
.
(17.5)
Az IEEE aritmetikai szabvány, amelyet késobb ismertetünk, kielégíti ezt a feltevést. A feltevés fontos következménye, hogy ab teljesül, hogy
, 0 esetén a muveletek relatív hibájára ugyancsak
|(ab) − (ab)| ≤u. |ab|
Tehát az aritmetikai muveletek relatív hibája kicsi. Vannak bizonyos lebegopontos aritmetikák, amelyek nem elégítik ki a (17.5) feltevést. o jegyük. Ennek az az oka, hogy a kivonásnál nincs egy ún. ellenorz
− 0.111 különbséget háromjegyu bináris arit-
Az egyszeruség kedvéért vizsgáljuk az 1
lépésben a kitevoket metikában. Az elso azonos értékre hozzuk
× ×
2
−
2
. .
0 0
1
0
0
0
1
1
.
1
Ha a számítást négy értékes jegyre végezzük, akkor az eredmény
× × ×
1
2
−
1
2
1
2
−2
a normalizált eredmény 2 amelybol
. . .
0 0 0
1
0
0
0
1
1
1
0
0
0
1
,
× 0.100. Vegyük észre, hogy a kivonásra került szám
jegye 0. A felhasznált ideiglenes negyedik mantisszajegyet elnem normalizált, mert elso o jegynek nevezzük. Ha nincs ilyen ellenorz o jegy, akkor a megfelelo számítások a lenorz következoképpen alakulnak: 1
2
−
1
2
1
2
−1
így a normalizált eredmény 2
× × ×
0 0 0
. . .
1
0
0
0
1
1
0
0
1
,
o jegye a · 0.100. Ennek relatív hibája 100%. Nincs ellenorz
CRAY szuperszámítógépeknek, valamint egy sor zsebkalkulátornak. o jegy, akkor a muveletek Ha nincs ellenorz eredményeire az (x
± y) = x (1 + α) ± y (1 + β) , |α| , |β| ≤ u , = (xy) (1 + δ) , |δ| ≤ u, = ∗, /
(xy)
(17.6) (17.7)
összefüggések teljesülnek. o jegy a kivonásnál és teljesül a (17.5) Tegyük fel a továbbiakban, hogy van ellenorz jelöléseket: feltevés. Vezessük be a következo
|z| = [|z1 | , . . . , |zn |]T (z ∈ Rn ) , h im,n m×n A ∈ R , |A| = ai j i, j=1
(17.8) (17.9)
724
17. Tudományos számítások
A
≤
B
⇔ ai j ≤ bi j
A, B
∈ Rm×n .
(17.10)
Igazolhatók az alábbi eredmények, ahol E az aktuális muvelet hibáját (hibamátrixát) jelöli:
xT y − xT y ≤ 1.01nu | x|T |y| (α A)
= αA + E
(| E |
(nu
≤ 0.01) ,
(17.11)
≤ u |αA|) ,
(17.12)
+ B) = (A + B) + E (|E | ≤ u |A + B|) , (AB) = AB + E |E | ≤ nu |A| | B| + O u2 . (A
(17.13) (17.14)
lebegopontos A szabvány modellnek eleget tevo aritmetikáknak számos sajátos tulajdonsága van. Fontos tulajdonságuk, hogy az összeadás a kerekítés miatt nem asszociatív. példa. Ezt mutatja a következo 17.4. példa. Ha a
= 1, b = c = 3 · 10−16 , akkor a MATLAB rendszerben AT386 számítógépen
1.000000000000000e
+ 000 = (a + b) + c , a + (b + c) = 1.000000000000001e + 000 .
Pentium1 100MHz-es processzorú gépen a b
= c = 1.15 × 10−16
választás ad hasonló eredményt.
(numerikus) processzorok esetén azonos számítáA példa azt is is mutatja, hogy eltéro lehetnek. Nagyszámú adat összegzésénél a kommutativitással sok eredményei különbözok (tulajdonképpen asszociativitással) is probléma lehet. Vizsgáljuk most a
Pn
i= 1
xi összeg ki-
számítását. A természetes algoritmus az ún. rekurzív összegzés: R´- ´ (n, x) ¨
←0 ← 1 to n do s ← s + xi
1
s
2
for i
3 4
return s
17.5. példa. Számítsuk ki az sn
=1+
n X
i=1
összeget n
1 i2
+i
= 4999 esetén. A rekurzív összegzéssel kapott MATLAB eredmény 1.999800000000002e
+ 000 .
sorrendben végezzük, akkor az eredmény Ha az összegzést fordított (azaz nagyság szerint növekedo 1.999800000000000e
+ 000 .
Ha a kétféleképpen kapott értékeket összevetjük az elméleti sn
=
2
− 1/(n +
1) összeggel, akkor
láthatjuk, hogy a második összegzés adott pontos eredményt. Ennek magyarázata az, hogy amikor a eredményben. kisebb tagokkal kezdjük, akkor ezek összegei értékes jegyeket érnek a végso
szám nagy pontosságú összeaNagy mennyiségu, elojelben és nagyságrendben eltéro algoritmus, amely az egyik legérdekesebb ilyen dása nem egyszeru feladat. A következo
725
17.1. Lebegopontos aritmetika és hibaelemzés
célra kifejlesztett eljárás, W. Kahantól származik. K ´ (n, x) ´ - ¨
7
←0 ←0 for i ← 1 to n do t ← s y ← xi + e s ← t+y e ← (t − s) + y
8
return s
1 2 3 4 5 6
s
e
17.1.4. A lebeg®pontos aritmetikai szabvány Az ANSI/IEEE Std 754-1985 bináris (β
=
2) lebegopontosó aritmetikai szabványt 1985-
lebegopontos ben hozták nyilvánosságra. A szabvány specikálja az alapveto muveleteket, összehasonlításokat, kerekítési módokat, az aritmetikai kivételeket és kezelésüket, valamint aritmetikai formák közti konverziót. A négyzetgyökvonás az alapveto muvelea különbözo tek közé tartozik. A szabvány nem mond semmit az exponenciális és transzcendens függ vényekrol. lebegopontos A szabvány két fo formátumot ismer: az egyszeres és a dupla pontosságút. típus
méret
mantissza
e
u
egyszeres
32 bit
23
8 bit
2
dupla
64 bit
+ 1 bit 52 + 1 bit
11 bit
2
−24 −53
≈ 5.96 × 10−8 ≈ 1.11 × 10−16
[ML , Mu ]
≈
±38
10
±308
10
Mindkét formátumban egy bitet az elojelnek tartanak fenn. Minthogy a lebegopontos szá jegy mindig 1, ez a jegy nincs tárolva. A mantisszában mok normalizálva vannak és az elso szereplo
+1 ezt a rejtett bitet jelzi.
aritmetikai kivéA szabvány eloírja a nem F-beli vagy F-beli számra nem kerekítheto telek kezelését is. kivétel típusa
példa
érvénytelen muvelet
0/0, 0
√ −1
túlcsordulás
× ∞, | xy| > Mu
osztás nullával
véges nemnulla/0
alulcsordulás
0
(Szubnormális számok a
±m · βL−t ,
< | xy| < 0
<
m
ML
< βt−1
eloírt eredmény NaN (Not a Number)
±∞ ±∞ szubnormális számok alakú számok.) Az IEEE aritmetika
zárt rendszer. Minden aritmetikai muveletnek van matematikailag értelmes vagy értelmet len eredménye. A kivételes muveletek esetén jelzést ad ki, amely után a számításokat eloírásszeruen folytatja. Az IEEE aritmetikai szabvány kielégíti a (17.5) modellt. Az IEEE szabvány hardver megvalósításai közül ki kell emelni az Intel 80x87 matematikai koprocesszorokat, a 80486 és a Pentium processzorokat, a DEC Alpha, a HP (Precision Architecture), az IBM RS/6000, az INMOS T800 és T900 processzorokat, a Motorola (680x0) és Sun (SPARCstation) processzorokat, valamint a HP tudományos kalkulátorait.
726
17. Tudományos számítások
Megjegyzés. Egyszeres pontosság esetén a mantissza hossza kb. 7 értékes jegyet enged meg a tízes számrendszerbe átszámolva. Ugyanez dupla pontosság esetén kb. 16 értékes jegyet jelent. Létezik még egy 80 biten ábrázolt, ún. kiterjesztett pontosság is, ahol t
=
63,
pedig 15 bites. a kitevo
Gyakorlatok
értékeket kaptuk: R1 = Két ellenállást muszerrel megmértünk és a következo ± 0.3Ω, R2 = 65.6 ± 0.2Ω. A párhuzamos kapcsolással kapott eredo ellenállást az ismert Re = R1 R2 /(R1 + R2 ) képlettel számoljuk. Határozzuk meg a bemeneti adatok relatív ellenállás Re közelíto értékét. Számítsuk ki a közelíto érték δRe hibakorlátjait és az eredo abszolút és δRe /Re relatív hibakorlátját háromféleképpen is: (i) a bemeneti adatoknak csak az abszolút korlátjait használva a δRe -t és ezután a δRe /Re
17.1-1. 110.2
relatív korlátot; (ii) a bemeneti adatoknak csak a relatív korlátjait használva a ezután a
δRe /Re relatív korlátot és
δRe abszolút korlátot;
ellenállást Re (iii) az eredo
√
17.1-2. Tegyük fel, hogy
=
F(R1 , R2 ) kétváltozós függvényként tekintve.
−8
2 -t 10
hibakorláttal tudjuk kiszámítani. Melyik kifejezést le-
het kisebb relatív hibával kiszámítani és hányszor kisebbel az alábbi két, elméletileg egyenlo két kifejezés közül:
√ 6 2 ; √ (ii) 99 − 70 2. (i) 1/ 1
+
Magyarázzuk is meg, miért. 17.1-3. Tekintsük az alapmuveleteket kétváltozós függvényeknek, azaz f (x, y)
= xy, ahol
a +, −, ∗, / muveletek valamelyike. (i) Vezessük le az alapmuveletek hibakorlátjait, mint kétváltozós függvényekét. (ii) Adjuk meg ezen függvények kondíciószámát. Mikor rosszul kondicionáltak ezek a függvények? pontos értéknek (iii) Vezessünk le hibakorlátot a hatványozásra, úgy is, hogy a kitevot hibával terhelt. tekintjük és úgy is, hogy mind az alap, mind a kitevo
= 16x2 és x ≈ a. A másodrendu hibatagot is gyelembe véve adjuk meg x 2 függvényében az a legnagyobb és legkisebb értékét úgy, hogy az y ≈ b = 16a közelítéssel számolva b relatív hibakorlátja legfeljebb 0.01 legyen. √ 2 17.1-4. A C = exp(4π / 83) (= 76.1967868 . . .) számot 24 bit hosszúságú lebegopontos (iv) Legyen y
aritmetikában számoljuk ki. (Az exponenciális függvényt is 24 értékes bittel adja a számítógépünk.) Becsüljük meg az eredmény abszolút hibáját. Adjuk meg a relatív hibát is a C konkrét értékének felhasználása nélkül. 17.1-5. Tekintsünk egy F(β, t, L, U ) lebegopontos számhalmazt. (i) Mutassuk meg, hogy bármelyik aritmetikai alapmuvelet eredményezhet aritmetikai túlcsordulást. (ii) Mutassuk meg, hogy bármelyik muvelet okozhat alulcsordulást is. kifejezések numerikusan instabilak x 17.1-6. Mutassuk meg, hogy a következo
≈ 0 esetén:
− cos x)/ sin2 x; (ii) sin(100π + x) − sin(x); −x (iii) 2 − sin x − cos x − e . (i) (1
Számítsuk ki a fenti kifejezések értékét x
= 10−3 , 10−5 , 10−7
esetén és becsüljük meg a
727
17.2. Lineáris egyenletrendszerek
hibát. Alakítsuk át a kifejezéseket numerikusan stabillá. 17.1-7. Hány eleme van az F
=
F (β, t, L, U ) halmaznak? Ezek között hány szubnormális
szám található? 17.1-8. Ismert, hogy nemnegatív x és y mellett a számtani közép nem kisebb a mértaninál, azaz (x + y)/2
≥
√
xy,és az egyenloség csak x
= y esetén áll fenn. Így van-e ez numerikusan
is? Ellenorizzük kísérletileg az állítást, ha x és y nagyságrendje azonosan igen kicsiny, illetve nagyságrendu igen nagy, valamint jelentosen eltéro x és y esetén is.
17.2. Lineáris egyenletrendszerek A lineáris egyenletrendszerek általános alakja m egyenlet és n ismeretlen esetén: a11 x1
+ · · · + a1 j x j + · · · + a1n xn
= .. .
b1
ai1 x1
+ · · · + ai j x j + · · · + ain xn
= .. .
bi
+ · · · + am j x j + · · · + amn xn
=
bm
am1 x1
(17.15)
.
Az egyenletrendszert megadhatjuk a tömörebb Ax formában is, ahol A Ha m
=
h ai j
im,n i, j=1
=b
∈ Rm×n ,
x
(17.16)
∈ Rn ,
b
∈ Rm .
< n, akkor az egyenletrendszert alulhatározottnak nevezzük. Ha m > n, akkor túlhatá= n esetben az egyenletrendszert négyzetesnek
beszélünk. Az m rozott egyenletrendszerrol
nevezzük. Itt csak a négyzetes egyenletrendszerekkel foglalkozunk és feltesszük, hogy az
−1
A
inverz mátrix létezik (ekvivalens feltétellel: det(A)
, 0). Ebben az esetben az egyenlet-
rendszernek egyértelmu megoldása van.
17.2.1. Lineáris egyenletrendszerek megoldásának közvetlen módszerei Ebben a pontban a Gauss- és Cholesky-módszert, valamint az LU-felbontást mutatjuk be. Háromszögmátrixú egyenletrendszerek
17.4. deníció. Az A ai j
=
[ai j ]
n i, j=1
mátrix felso háromszög alakú, ha minden i
= 0. Ha pedig az ai j = 0 minden i <
>
j esetén
j esetén teljesül, akkor alsó háromszög alakú.
háromszögmátrixok alakja sematikusan a következo: Például a felso
728
17. Tudományos számítások
17.2. ábra. Gauss-elimináció.
∗
∗
···
0
∗ .. .
..
.. . .. .
..
···
0
. ∗ ∗
···
∗ .. . .. .
.
. ···
∗ 0
háromszögmátrixok. Megjegyzés. A diagonálmátrixok egyidejuleg alsó és felso háromszögmátrixok esetén det(A) Igazolható, hogy alsó vagy felso
=
a11 a22
. . . ann . A
háromszögmátrixú egyenletrendszerek megoldása igen egyszeru. Tekintsük az a11 x1 +
··· .. .
+a1i xi + .. .
···
aii xi +
··· .. .
+a1n xn .. .
=
+ain xn .. .
=
ann xn
=
b1
.. .
bi
.. .
bn
háromszögmátrixú egyenletrendszert. Ennek megoldását a következo, ún. visszahefelso lyettesíto algoritmus adja: V´ ´ (A, b, n)
← bn /ann ← n − 1 downto 1 Pn ai j x j )/aii do xi ← (bi − j=i+1
1
xn
2
for i
3 4
return x
Az alsó háromszögmátrixú egyenletrendszer megoldása hasonló. A Gauss-módszer A Gauss-féle eliminációs módszer (lásd 17.2) két fázisból áll: I. Azonos átalakításokkal az Ax
= b egyenletrendszert felso háromszög alakúra hozzuk.
háromszög alakúra hozzuk. (A 17.2 ábra sematikusan mutatja, hogy a teli együtthatómátrixú egyenletrendszert hozunk létre, amelynek × x olyan A A × x = b egyenletrendszerbol = b együtthatómátrixa már felso háromszögmátrix.) az A háromszögmátrixú egyenletrendszert a visszahelyettesíto II. A kapott felso algoritmus háromszög alakra hozás során az együtthatómátrix foátló sal megoldjuk. A felso alatti ele-
729
17.2. Lineáris egyenletrendszerek
meit az egyenletrendszer ekvivalens átalakításával használjuk fel, hogy alkalmasan megválasztott egy másik, pl. k-adik egyenlet
γ-szorosát
γ
nullázzuk. Ehhez azt az észrevételt konstanssal valamely i-edik egyenletbol
az egyik ismeretkivonva, az i-edik egyenletbol
len kiiktatható (eliminálható), miközben az egyenletrendszer megoldása természetesen nem változik. (k Tegyük fel, hogy az elso a11 x1 +
··· .. .
− 1) oszlopban a nullázást már elvégeztük és az · · · +a1k xk .. . .. .. . .
+ ···
+
a1n xn
=
akn xn
=
ain xn
=
ann xn
=
.. . .. .
akk xk
+ ···
aik xk
+ ···
ank xk
+ ···
+
.. .
.. . .. .
.. .
+
.. .
bk
.. .
.. .
+
b1
bi
.. .
bn
, 0, akkor az akk alatti xk együtthatókat az i-edik sorból a γ = aik /akk -szorosa kivonásával nullázhatjuk ki. Ugyanis az
egyenletrendszert kaptuk. Ha akk k-adik sor
(aik
− γakk )xk + (ai,k+1 − γak,k+1 )xk+1 + · · · + (ain − γakn )xn = bi − γbk
γ-val éppen a kívánt aik − γakk = 0 adódik. Ezt az eloírást végre= 1, 2, . . . , n − 1 oszlopok és egy-egy oszlopon belül az i = k + 1, . . . , n sorszámú sorok mindegyikére, kialakul a felsoháromszög mátrix. A következokben A i, j az A mát o szeletét rix ai j elemét, az A i, j : n pedig a mátrix i-edik sorának a j-edik oszloptól kezdod egyenletben a választott hajtva a k
jelöli. Ezzel az egyenletrendszert megoldó algoritmus (az algoritmusban már itt feltüntettük pontban tárgyalt pivotálás helyét is): a következo G- (A, b) ´ 0 1 2 3
B I. (eliminációs) fázis. n ← sorok[A] for k ← 1 to n − 1 do {pivotálás esetén foelemkiválasztás, majd sor-, illetve oszlopcsere}
8
← k + 1 to n γik ← A [i, k] /A [k, k] A [i, k + 1 : n] ← A [i, k + 1 : n] − γik ∗ A [k, k + 1 : n] bi ← bi − γbk fázis: lásd a V´ B II. (visszahelyettesíto) ´ algoritmust.
9
return x
4 5 6 7
for i
do
Az algoritmus felülírja az eredeti mátrix és a jobboldali vektor elemeit, ugyanakkor a foátló alatti nullákat nem írja be. A nullák beírása egyrészt felesleges lenne, hisz azokra az elemekre a II. fázis nem hivatkozik. Ugyanakkor a nullák helyén a késobb tárgyalandó LU -felbontáshoz szükséges információkat orizhetjük meg. A Gauss-módszert természetesen csak akkor lehet végrehajtani, ha a mindenkori akk
730
17. Tudományos számítások
elem nem nulla. Emiatt is, de foként a numerikus stabilitás miatt a módszert foelemkiválasztással szoktuk alkalmazni. A foelemkiválasztásos Gauss-módszer Amennyiben az akk elem nulla, az eliminációs eljárást megkísérelhetjük úgy folytatni, hogy elem kerüljön. Amennyiben ez sem lehetsorcserével a (k, k) pozícióra nullától különbözo séges, mert az akk , ak+1,k , . . . , ank mindegyike nulla, akkor az együtthatómátrix determinánsa nulla, egyértelmu megoldás nem is létezik. Az akk elemet k-adik pivotelemnek nevezzük. A sorok felcserélésével új pivot elem választható. A pivot elem megválasztása nagymértékben befolyásolja az eredmények megbízhatóságát. Már csak amiatt is, hogy osztunk vele, amely négyzetével fordítva arányos. A lehetoség muvelet hibája mint korábban láttuk a nevezo szerinti minél nagyobb abszolút értéku pivot elem választás az elonyös. Az ilyen választást pivotálási, vagy foelemkiválasztási eljárásnak nevezzük. Kétféle pivotálási stratégiát említünk meg. Részleges foelemkiválasztás: A k-adik lépésben a k-adik oszlop a jk (k
≤ j ≤ n) elemei
közül kiválasztjuk a maximális abszolút értékut. Ha ennek indexe i, akkor a k-adik és az i-edik sort felcseréljük. A pivotálás után teljesül, hogy
|akk | = max |aik | . k≤i≤n
Teljes foelemkiválasztás : A k-adik lépésben az ai j (k
≤ i, j ≤
n) mátrixelemek közül
kiválasztjuk a maximális abszolút értékut. Ha ennek indexe (i, j), akkor a k-adik és az i-edik sort, valamint a k-adik oszlopot és j-edik oszlopot felcseréljük. A pivotálás után teljesül, hogy
|akk | =
.
max ai j
k≤i, j≤n
Megjegyezzük, hogy oszlopcsere esetén változócsere is történik. Jól illusztrálja a pivotálás jelentoségét a következo 17.6. példa.
−17
10
x
x
+ +
y y
= =
1 2
, .
= 1/(1 − 10−17 ), y = 1 − 10−17 /(1 − 10−17 ). A MATLAB szerinti számábrázolásában (x) = (y) = 1, vagyis ennél jobb közelítést a érhetünk el. Pivotálás nélküli Gauss-módszerrel megoldva az x = 0, y = 1
Ezen egyenletrendszer pontos megoldása: x duplapontos szabvány MATLAB-ban nem is
katasztrofálisan hibás eredmény adódik, míg részleges foelemkiválasztással megkapjuk az elméletileg legjobb, azaz x elérheto
= y = 1 közelíto megoldást.
17.5. megjegyzés. Nem kell végrehajtani foelemkiválasztást a következo esetekben: 1. Ha A szimmetrikus és pozitív denit (A x
, 0)
∈ Rn×n
pozitív denit
⇔
T
x Ax
>
0,
∀ x ∈ Rn ,
.
2. Ha A diagonálisan domináns a következo értelemben:
|aii | >
X a ij
(1
≤ i ≤ n) .
j,i
Szimmetrikus és pozitív denit A mátrix esetén a Gauss-elimináció egy késobb ismertetendo speciális alakját, a Cholesky-módszert használjuk az egyenletrendszer megoldására.
731
17.2. Lineáris egyenletrendszerek
együttható mátrixú egyenletA Gauss-elimináció során valójában egymástól különbözo rendszereket kapunk (habár a közölt algoritmus szerint a számítógép zikailag egy helyen tárolja valamennyit és az alsó háromszög részbe nem is írja be a nullákat), azaz az A
(0)
x
= b(0) →
A
(1)
= b(1) → · · · →
x
(n−1)
A
x
= b(n−1)
álló sorozatot, ahol ekvivalens egyenletrendszerekbol A
(k)
=
h
(k)
ai j
in
.
i, j=1
Az eliminációs fázis végén az
A
mátrix alakul ki, ahol a
(k−1) kk
(n−1)
=
(0)
(0)
0
a
··· ··· .. .
0
···
···
a
11
a
12 (1) 22
.. .
ann
a
1n (1) 2n
.. .
(n−1)
vagy pivotelem. A pivotelemek növekedési tényea k-adik fo-,
zoje:
ρ = ρn = Igen fontos kérdés a
(0)
a
(k−1)
max a
kk
1≤k≤n
. /a(0) 11
ρ növekedési tényezo nagyságrendje, mert ez összefüggésben áll az el-
megoldás hibája arányos járás numerikus stabilitásával. Wilkinson igazolta, hogy a közelíto a
ρ növekedési tényezovel, amelyre teljes foelemkiválasztás esetén a
ρ≤
√
n 2
1
· 3 ···n 2
1
n−1
1 2
∼ cn
1 2
1
n4
log(n)
,
részleges foelemkiválasztás esetén pedig a
ρ ≤ 2n−1 korlát teljesül. Wilkinson azt sejtette, hogy teljes foelemkiválasztás esetén
ρ≤
n . Ezt kis
≤ ρ nagyságrendje átlagosan Θ n2/3 a részleges és Θ n1/2 a teljes foelemkiválasztás esetén. Tehát a ρ > n eset statisztikai értelemben ritkán fordulhat elo.
n értékekre többen is igazolták. Véletlen mátrixokon végzett statisztikai vizsgálatok (n 1024) azt mutatják, hogy
Megjegyezzük, hogy Wilkinson konstruált egy példát, amelyre részleges foelemkiválasztás esetén
ρ = 2n−1 , tehát ez a korlát pontos. Újabban találtak néhány, a gyakorlatban is
megoldásánál) eloforduló (differenciál- és integrálegyenletek közelíto esetet, amikor a rész leges foelemkiválasztáson alapuló Gauss-módszer
ρ növekedési tényezoje exponenciálisan
és a módszer csodöt no mond. nagyon A foelemkiválasztás nélküli Gauss-elimináció esetén a növekedési tényezo nagy lehet. Például az
1.7846 −3.3848 A = −0.2760 −0.2760 mátrix esetén a növekedési tényezo
−0.2760 0.7240 −0.2760 −0.2760
−0.2760 −0.3492 1.4311 −0.2760
−0.2760 −0.2760 −0.2760 0.7240
ρ = ρ4 (A) = 1.23 × 105 .
732
17. Tudományos számítások
A Gauss-módszer muveletigénye A Gauss-módszer véges sok lépésben, véges sok aritmetikai alapmuvelet ( +, −, zése után megadja az Ax
∗, / ) elvég= b (A ∈ Rn×n ) egyenletrendszer megoldását. A szükséges aritme-
tikai muveletszám (muveletigény) az egyenletrendszer megoldó eljárások fontos minoségi jellemzoje, mert az ilyen algoritmusok számítógépideje nagyjából arányos az aritmetikai muveletigénnyel. Meggyelték, hogy a lineáris algebra számítási eljárásaiban az additív és a multiplikatív muveletek száma nagyon gyakran közel azonos. Egy multiplikatív muve let ideje hagyományos számítógépeken lényegesen több mint egy additív muveleté, de ez a nagyságrendi eltérés nem akkora, hogy az additív muveleteket elhanyagolhatnánk. C. B. Moler a számítási igény mérésére bevezette az 1 (régi) op fogalmát. A nagyteljesítményu szuperszámítógépeken nincs lényeges különbség az additív és a multiplikatív muveletekre között, ezért újabban az új op fogalmát is használják. fordított ido
= s+ x∗y muvelet (1 összeadás + 1 szorzás) elvégzéséhez kell, 1 (új) op pedig az a számítási munka, amely egy +, −, ∗, /
17.6. deníció. 1 (régi) op az a számítási munka, amely az s aritmetikai muvelet elvégzéséhez kell.
Egy régi op 2 új oppal azonos. Mi a régi op értelmezést használjuk. A Gaussmódszer additív és multiplikatív muveletigényét egyszeru számolással megkapjuk, a teljes muveletigényt mondja ki a következo 3
17.7. tétel. A Gauss-módszer muveletigénye n
/3 + Θ(n2 ) op.
Klyuyev és Kokovkin-Shcherbak igazolta, hogy ha csak sor- és oszlopmuveleteket (sor, vagy oszlop számmal való szorzása; sorok, vagy oszlopok cseréje; sorok, vagy oszlopok számszorosának sorokhoz, vagy oszlopokhoz való hozzáadása) engedünk meg, akkor nem 3
lehet n
/3 + Ω(n2 ) opnál kevesebb muvelettel az Ax = b lineáris egyenletrendszert megol-
dani. Az Ax
=
b alakú n
× n-es
egyenletrendszerek megoldásához szükséges muveletigény 2.808
gyors mátrixinvertáló eljárásokkal O(n
) opra leszorítható. A jelenleg ismert eljárásokat
numerikus instabilitásuk miatt gyakorlatilag nem használják. Az LU-felbontás Sok esetben könnyebb a problémát megoldani, ha valamely mátrixot két, bizonyos szem pontból elonyösebb tulajdonságú mátrix pl. két háromszögmátrix szorzatára tudunk bontani. 17.8. deníció. Az A
∈ Rn×n
= LU szorzatalakban tör∈ Rn×n pedig felso háromszögmátrix.
mátrix LU-felbontásán a mátrix A
téno felbontását értjük, ahol L
∈ Rn×n
alsó, U
Az LU -felbontás nem egyértelmu. Viszont, ha egy nemszinguláris mátrixnak létezik foátlójában LU -felbontása, akkor olyan is létezik, amelyben valamelyik tényezo csupa egyes áll. Az ilyen háromszögmátrixot egység háromszögmátrixnak nevezzük. Ez a felbontása a nemszinguláris mátrixoknak már egyértelmu (persze, ha egyáltalán létezik). Nemszinguláris mátrixok LU -felbonthatóságára a Gauss-eliminációval való kapcsolat ad választ. Igazolható, hogy abban az A
=
LU szorzatban, amelyben L egység alsóhá-
romszög mátrix, a foátló alatti lik elemekre lik
= γik , ahol γik
a Gauss-módszer algoritmus
szerinti. Az U pedig az algoritmus eliminációs fázisa végeredményeként eloállított felso
733
17.2. Lineáris egyenletrendszerek
a táblából, amennyiben az alsó háromszögrész háromszögmátrix. A L is kiolvasható ebbol oszlopait végigosztjuk a foátlóbeli elemekkel. Emlékeztetünk arra, hogy a Gauss-módszer algoritmus végrehajtása során a foátló alatti elemeket zikailag nem nulláztuk ki.) Világos, hogy nemszinguláris A esetén akkor és csak akkor létezik LU -felbontás, ha a pivotálás (k−1)
nélküli Gauss-elimináció során a
kk
, 0 minden pivotelemre teljesül.
17.9. deníció. A négyzetes P mátrixot permutációmátrixnak nevezzük, ha minden sorában és oszlopában pontosan egy darab 1-es van és a többi elem zérus. Részleges foelemkiválasztás esetén a sorokat permutáljuk (más szóval: egy permutációmátrixszal szorzunk balról) és az akk
,
0 (k
= 1, . . . , n) minden nemszinguláris mátrixra
teljesül. Igaz tehát a következo 17.10. tétel. Ha az n × n-es A mátrix nemszinguláris, akkor létezik olyan P permutációmátrix, hogy a PA mátrixnak van LU -felbontása. Az LU -felbontás algoritmusa tehát lényegében a Gauss-elimináció algoritmusa. Ter mészetesen, ha részleges foelemkiválasztással keressük a felbontást, akkor a sorcseréket a foátló alatti (zikailag nem nullázott) elemeken is el kell végezni és a P mátrixot is meg kell jegyezni (pl. úgy, hogy egy vektorban tároljuk a mátrixsoroknak az eredetihez képesti mindenkori sorrendjét). Az LU- és Cholesky-módszerek Legyen A
=
LU és vizsgáljuk az Ax
b összefüggés miatt felbontható az Ly
= =
b megoldását. Ez az Ax
=
LU x
=
b alsó háromszögmátrixú és az U x
L(U x)
=
=
y felso
háromszögmátrixú egyenletrendszerek megoldására. LU- (A, b) ´
3
= LU felbontást = b egyenletrendszert oldjuk meg az U x = y egyenletrendszert
4
return x
1
határozzuk meg az A
2
oldjuk meg az Ly
PA
= Megjegyzés. Ha részleges foelemkiválasztást alkalmazunk, akkor értelemszeruen az A = Pb vektort LU felbontást kapjuk (kimenetként a P-t is), majd jobb oldalként a b
=
vesszük. Az eredeti Gauss-módszer I. fázisában az A
=
LU felbontást és az U x
=
L
−1
b felso
A II. fázisban ezt az egyenletrendszert háromszögmátrixú egyenletrendszert állítjuk elo. oldjuk meg. Az LU-módszerben a Gauss-módszer I. fázisát két lépésre bontjuk fel. Az elso lépésben az A
=
és értelemszeruen LU felbontást állítjuk elo nem végzünk számításokat a
b oszlopvektoron. Az eljárás második lépésében az y
=
L
−1
Az eljárás b vektort állítjuk elo.
harmadik lépése megegyezik az eredeti Gauss-módszer II. fázisával. Az LU-módszer különösen elonyös, ha ugyanazon együtthatómátrixszal egynél több Ax
= b1 ,
Ax
= b2 , . . . ,
Ax
= bk
alakú egyenletrendszert kell megoldani. Ekkor elég az A mátrix LU-felbontását egyszer
734
17. Tudományos számítások
= bi , U xi = yi (xi , yi, bi ∈ Rn , i = 1, . . . , k) háromszögmát3 2 rixú egyenletrendszereket megoldani. Az eljárás összköltsége: n /3 + kn + Θ (kn) op. n×n Ezen észrevétel alapján egy A ∈ R mátrix invertálását az LU-módszer segítségével meghatározni, majd rendre az Lyi
a következoképpen végezhetjük: 1. Meghatározzuk az A
=
LU felbontást.
2. Sorra meghatározzuk az Lyi
=
ei , U xi
=
yi (ei az i-edik egységvektor, i
egyenletrendszerek xi megoldásait. Az A inverze A 3
Az eljárás muveletigénye 4n
/3 + Θ
2
n
−1
= 1, . . . , n)
= [x1 , . . . , xn ].
op.
Az LU-módszer pointeres technikával Lényegében a 60-as évek eleje óta ismert. A P vektor tartalmazza a sorok indexeit. Induláskor P [i]
=
i (1
≤
i
≤
indexu n). Sorcserék esetén ténylegesen csak a P vektor megfelelo
elemeit cseréljük ki. LU- -- (A, b) ´ ´
← sorok[A] ← [1, 2, . . . , n] for k ← 1 to n − 1
1
n
2
P
3 4
do határozzuk meg a t indexet, amelyre | A [P [t] , k]|
5 6
then cseréljük fel a P [k] és a P [t] komponensek értékét
7
for i
← k + 1 to n
do A [P [i] , k]
8
A [P [i] , k
9
← A [P [i] , k] /A [P [k] , k] + 1 : n] ← A [P [i] , k + 1 : n] − A [P [i] , k] ∗ A [P [k] , k + 1 : n]
19
← 1 to n ←0 for j ← 1 to i − 1 do s ← s + A P [i] , j ∗ x j x [i] ← b[P[i]] − s for i ← n downto 1 do s ← 0 for j ← i + 1 to n s ← s + A P [i] , j ∗ x j x [i] ← (x [i] − s) /A [P [i] , i]
20
return x
10 11 12 13 14 15 16 17 18
= maxk≤i≤n |A [P [i] , k]|
j + p vagy i + q <
j
.
A sávot, amelynek elemei lehetnek nemnullák, azon ai j elemek deniálják, amelynek indexeire teljesül, hogy i − p ábrázolva
≤ j ≤ i + q, vagy ekvivalens módon j − q ≤ i ≤ j + p. Sematikusan
736
17. Tudományos számítások
A =
a11
a12
a21
a22
.. .
··· ..
···
..
0
···
···
. ..
.
0
0
.. . .. .
. ..
···
.
an−q,n
. ..
0
.
.
.
0
.. . .. .
. ..
.. ..
···
.
. ..
..
.. ..
.. . .. . .. .
···
0
. ..
a1+ p,1
a1,1+q
···
an,n− p
.
an,n−1
an−1,n ann
.
A sávmátrixok akkor érdekesek, ha p és q jóval kisebb mint n. Ismert, hogy ha létezik sávszélességgel.A követkeLU-felbontás, akkor L és U is sávmátrix, az A-beli alsó és felso zokben három részletben megadjuk az LU-módszer sávos változatát. S -LU- ´ ´ ´ (A, n, p, q) 1 2
for k
←1
3 4 5 6
−1 ← k + 1 to min {k + p, n} do aik ← aik /akk for j ← k + 1 to min {k + q, n} do ai j ← ai j − aik ak j to n
do for i
return A Az ai j fogja tartalmazni li j -t, ha i
c ( p, q) op, ahol
( c ( p, q)
=
>
− n pq −
n pq
j és ui j -t, ha i
1 2 1 2
pq
2
qp
2
− −
1 6 1 6
3
p q
3
≤
j. Az algoritmus muveletigénye
+ pn, + qn,
algoritmus felülírja a b vektort az Ly A következo
p p
≤q >q
= b egyenletrendszer megoldásával.
S - ´ -(L, b, n, p) ´ ´ - ´ ¨ ´ 1 2 3
for i
←1
do bi
to n
← bi −
Pi−1
j=max{1,i− p}
li j b j
return b Az algoritmus muveletigénye np
− p2 /2 op.
algoritmus felülírja a b vektort az U x A következo
= b egyenletrendszer megoldásával.
S - ´ -(U, b, n, q) ´ - ´ ¨ ´ 1 2 3
← n downto 1 Pmin{i+q,n} do bi ← bi − ui j b j /uii j=i+1
for i
return b
737
17.2. Lineáris egyenletrendszerek
Az algoritmus muveletigénye n (q Legyen A
∈ R
n×n
+ 1) − q2 /2 op.
szimmetrikus, pozitív denit p alsó sávszélességgel. A Cholesky-
felbontás sávos változata: S -C- ´ ´ ´ (A, n, p) 1
for i
2
←1
3
← max {1, i − p} to i − 1 P ← ai j − kj−=1max{1,i− p} aik a jk /a j j 1/2 P ← aii − ik−=1max{1,i− p} a2ik do ai j
4
aii
5
return A
to n
do for j
Az ai j elemek tartalmazzák az li j elemeket (i
3
p
≥
j). Az eljárás muveletigénye np
/3 + (3/2) n p − p2 op és n négyzetgyökvonás. n×n sávszélességu Megjegyzés. Ha az A ∈ R p alsó és q felso
2
/2 −
sávmátrixon részleges
háromszögmátrix sávszélessége foelemkiválasztást kell végrehajtani, akkor az U sávos felso a sorcsere végrehajtásakor megnohet, legfeljebb a q
=
p
+ q értékre.
17.2.2. Lineáris egyenletrendszerek iteratív megoldási módszerei Lineáris egyenletrendszerek megoldására számos iteratív módszer ismert. Ezek közül legismertebbek a klasszikus Jacobi, a Gauss-Seidel és a különféle relaxációs módszerek. Az könnyu iteratív módszerek legfobb elonye a nagyméretu rendszerekre történo alkalmazhatóságuk. Hátrányuk ugyanakkor az esetleges lassú konvergencia, amely háttérbe szorította ezeket a módszereket. Bizonyos típusú feladatok megoldásánál azonban, a könnyu párhuza mosíthatóság miatt újra elotérbe kerültek az ún. multifelbontású ( multisplitting) iteratív algoritmusok. Tekintsük az xi
= G xi−1 + b
(i
= 1, 2, . . .)
∈ Rn×n és x0 , b ∈ Rn . Ismert, hogy az { xi }∞ akkor és csak akkor koni=0 n vergál minden x0 , b ∈ R esetén, ha a G mátrix spektrálsugarára ρ (G) < 1 teljesül −1 ∗ b, azaz (ρ (G) = max |λ| | λ a G sajátértéke ). Konvergencia esetén xi → x = (I − G) az (I − G) x = b egyenletrendszer megoldását kapjuk. A konvergencia gyorsasága a ρ (G) spektrálsugár nagyságától függ. Minél kisebb ρ (G), annál gyorsabb a konvergencia. iterációt, ahol G
Tekintsük most az Ax egyenletrendszert, ahol A
∈ Rn×n
=b
nemszinguláris mátrix. Az Ml , Nl , E l
∈ Rn×n
mátrixokat
az A multifelbontásának nevezzük, ha (i)
A
=
Mi
− Ni , i = 1, 2, . . . , L,
(ii) Mi nemszinguláris, i
= 1, 2, . . . , L,
(iii) E i nemnegatív diagonális mátrix, i (iv)
PL
i=1
Adott x0
Ei
=
= 1, 2, . . . , L,
I.
∈ Rn kezdovektorral a felbontáshoz tartozó iteratív módszer a következo.
738
17. Tudományos számítások
I (x0 , L, Ml , Nl , E l , l ´ ´ - ´
←0
1
i
2
while kilépési feltétel
= ←i+1 for l ← 1 to L do Ml yl ← Nl xi−1 + b PL xi ← E l yl l=1
3
do i
4 5 5 7
= 1, . . . , L)
return xi Egyszeru számolással kapjuk, hogy yl
xi
=
L X
E l yl
L X
=
−1
E l Ml
l=1
=
M
Nl xi−1
−1 l
Nl xi−1
+ Ml−1 b és
L X
+
−1
E l Ml
l=1
=
b
H xi − 1
+c .
l= 1
Tehát a konvergencia feltétele:
ρ (H) < 1. A multifelbontás algoritmus valódi párhuza-
mos algoritmus , mert iterációnként L lineáris egyenletrendszert lehet párhuzamosan megoldani (szinkronizált párhuzamosság). Az eljárás szuk keresztmetszete xi iterált számítása. Az Mi mátrixok és az E i
súlymátrixok megválasztása célszeruen úgy történik, hogy
= c egyenletrendszer megoldása olcsó legyen. Legyen S 1 , S 2 , . . . , S L az {1, . . . , n} L halmaz partíciója, azaz S i , ∅, S i ∩ S j = ∅ (i , j) és ∪i=1 S i = {1, . . . , n}. Legyenek továbbá az S i ⊆ T i ⊆ {1, . . . , n} halmazok (i = 1, . . . , L) olyanok, hogy legalább egy l indexre S l , Tl.
az Mi y
Az A mátrix nemátfedo blokk Jacobi-multifelbontását az
Ml
Nl
El
eloírás (l
=
=
=
h
(l)
Mi j
Ml
h
in i, j=1
(l)
,
Mi j
=
ai j ,
ha i, j
aii ,
ha i
0
=
∈ Sl , j , ,
egyébként,
−A,
(l)
Ei j
(
in i, j=1
e(l) = E ij
,
1,
ha i
0
= j ∈ Sl
egyébként
= 1, 2, . . . , L) deniálja.
Deniáljuk az A
=
M
−N
egyszeru felbontást is, ahol M nemszinguláris,
M
=
h Mi j
in i, j=1
( ,
Mi j
=
ai j , 0
ha i, j
∈ Sl
valamely l
∈ {1, . . . , n} értékre
egyébként .
blokk Jacobi-multifelbontásra fennáll, hogy Megmutatható, hogy a nemátfedo
H
=
L X
−1
E l Ml l= 1
Nl
=
M
−1
N
.
,
.
739
17.2. Lineáris egyenletrendszerek
Az A mátrix átfedo blokk Jacobi-multifelbontását az
el M
el N
in (l)
h
e = M ij
i, j=1
i, j=1
= 1, 2, . . . , L) deniálja. ∈ Rn×n
Egy nemszinguláris A
−1
A
(l)
ai j ,
ha i, j
aii ,
ha i
0
=
∈ Tl , j , ,
egyébként .
el − A , =M
h (l) in e ei j el = e eloírás (l
e M ij
,
=
(l)
,
E ii
= 0, ha i < T l
mátrixot M-mátrixnak nevezünk, ha ai j
≤
0 (i
,
j) és
elemei nemnegatívak. Igaz a következo
17.12. tétel. Tegyük fel, hogy A
n
átfedo,
ei , N ei , Ei M
oL
i=1
∈ Rn×n
L
nemszinguláris M-mátrix, { Mi , Ni , E i }i=1 az A nem-
pedig az A átfedo blokk Jacobi-multifelbontása, amelyekben az E i
súlymátrixok közösek. Ekkor igaz, hogy
e ≤ ρ (H) < 1 , ρ H ahol H
=
PL
l=1
El M
−1 l
e Nl és H
=
PL
l=1
e El M
−1 e Nl .
l
eljárás konvergenciája nem lassúbb mint Tehát mindkét eljárás konvergens és az átfedo eljárásé. A tétel igaz marad akkor is, ha a blokk Jacobi-multifelbontások helyett a nemátfedo
ei blokk Gauss-Seidel típusú multifelbontásokat használunk. Ekkor a fent deniált Mi és M mátrixok helyett az alsó háromszög részüket kell venni. A multifelbontás algoritmusnak többlépéses és aszinkron változatai is ismertek.
17.2.3. Lineáris egyenletrendszerek hibaelemzése A vizsgálatban a direkt és az inverz hibákat elemezzük. Az Ax
= b egyenletrendszer megol-
jelöléseket és fogalmakat használjuk. Az elméleti megoldásával kapcsolatban a következo
∆ x = x − x. = r (y) = Ay − b mennyiséget reziduális hibának nevezzük. Az elméleti megoldás ese megoldás esetén pedig tén r (x) = 0, a közelíto megoldásokat pedig x megoldás direkt hibája dást x, a közelíto jelöli. A közelíto
Az r
r ( x)
=
Ax
−b=
A (x
− x) = A∆ x .
Az inverz hiba meghatározásához különféle modelleket használunk. A legáltalánosabb eset egyenletrendszert, ahol x ben feltesszük, hogy az x számított megoldás kielégíti az A = b A
=
A
+ ∆A és b = b + ∆b. A ∆A és ∆b mennyiségeket inverz hibáknak nevezzük.
Meg kell különböztetnünk a probléma érzékenységét és a megoldó algoritmusok stabilitását. Egy adott probléma érzékenységén a megoldás változásának mértékét értjük a probléma (bemeneti) paramétereinek függvényében. Egy algoritmus érzékenységén vagy stabilitásán a számítási hibák végeredményre gyakorolt hatásának mértékét értjük. Egy problémát vagy algoritmust annál stabilabbnak tekintünk mennél kisebb a bemeneti paraméterek, ill. számítási hibák megoldásra (számított megoldásra) gyakorolt hatása. Az érzékenység,
740
17. Tudományos számítások
ill. stabilitás fogalmának egyik jellemzési formája a korábban látott kondíciószám, amely az eltérések relatív hibáit hasonlítja össze. általános elveit lehet megfogalmazni: Algoritmusok felhasználásának a következo 1.
A gyakorlatban csak stabil (jól kondicionált) algoritmusokat használunk.
2.
Instabil (inkorrekt kituzés u vagy rosszul kondicionált) feladatot általános célú algoritmusokkal általában nem tudunk megoldani.
Érzékenységvizsgálat Tegyük fel, hogy az Ax
= b egyenlet helyett a perturbált = b + ∆b
Ax egyenletrendszert oldjuk meg. Legyen x 17.13. tétel. Ha A nemszinguláris és b
(17.17)
= x + ∆ x és vizsgáljuk a két megoldás eltérését.
, 0, akkor
k k∆bk kr ( x) k∆ xk ≤ cond(A) = cond(A) , k xk kbk kbk
−1 ahol cond(A) = k Ak A az A mátrix ún. kondíciószáma.
(17.18)
látható, hogy az A mátrix kondíciószáma erosen A tételbol befolyásolhatja az x perturbált megoldás relatív hibáját. Egy rendszert jól kondicionáltnak nevezünk, ha cond(A) kicsi, és rosszul kondicionáltnak nevezünk, ha cond(A) nagy. Értelemszeruen a nagy és ki relatívak és környezetfüggok. csi jelzok A kondíciószám függ a normától. Ha a normától való függés például cond∞ (A)
lényeges, akkor ezt külön jelöljük. Ennek megfeleloen
kAk∞
A−1
∞ .
=
A kondicionáltság egy lehetséges geometriai jellemzését adja a következo
példa. 17.7. példa. Az 1000x1 999x1
+ +
egyenletrendszer rosszul kondicionált (cond∞ (A)
999x2 998x2
= =
b1 b2
= 3.99 × 10
6
). A két egyenes majdnem párhuzamos.
ot ol. Ezért, ha perturbáljuk a jobb oldalt, az új metszéspont messze lesz az eloz
A most vizsgált modellben az inverz hiba
∆b, a 17.13. tétel pedig a relatív direkt hibára
látszik: az ad becslést. Ez teljes összhangban van a hibaszámítási ökölszabállyal. A tételbol k / kbk relatív reziduális hiba kicsi voltából csak akkor következik, hogy az x perturbált kr ( x) megoldás relatív hibája is kicsi, ha A kondíciószáma kicsi.
= b egyenletrendszert, ahol " # " # 1+ 1 1 A = , b= ,
17.8. példa. Tekintsük az Ax
1
" Legyen x
=
2
−1
# . Ekkor r
" =
2 0
1
1
" x
=
0 1
# .
# és kr k∞
/ kbk∞ = 2 , de k x − xk∞ / k xk∞ = 2.
741
17.2. Lineáris egyenletrendszerek
Tegyük most fel, hogy az Ax
= b egyenletrendszer helyett a perturbált (A
+ ∆A) x = b
(17.19)
egyenletrendszert oldjuk meg. Igazolható, hogy ennél a modellnél több inverz hiba is létezik, ezek közül x , r ( x)
,
0 esetén a minimális spektrálnormájú inverz hiba:
∆A =
T T −r ( x) x /x x.
tétel azt mondja ki, hogy kis relatív reziduális hiba esetén a relatív inverz A következo hiba is kicsi.
, 0 az Ax = b egyenletrendszer közelíto megoldása, T T , 0. Ha kr ( x) k2 / kbk2 = α < 1, akkor a ∆ A = −r ( x) x /x x mátrixra fennáll, hogy (A + ∆ A) x = b és k∆ Ak2 / k Ak2 ≤ α/ (1 − α). 17.14. tétel. Tegyük fel, hogy x det (A)
,
0 és b
Ha a relatív inverz hiba kicsi és A kondíciószáma kicsi, akkor a relatív reziduális hiba tétel. is kicsi. Erre mutat rá a következo 17.15. tétel. Ha r ( x) =A x − b, (A
+ ∆A) x=b, A , 0, b , 0 és cond (A) k∆Ak / kAk < 1, akkor k∆Ak k Ak k∆Ak cond(A) k Ak
cond(A)
k kr ( x) ≤ kbk
1
−
.
(17.20)
Ha A rosszul kondicionált, akkor a 17.15. tétel állítása nem teljesül.
"
+
#
1
"
0
0
#
"
1
#
, ∆A = és b = , (0 < − 0 2 −1 2 2 cond∞ (A) = (2 + ) / ≈ 4/ és k∆ Ak∞ / k Ak∞ = / (2 + ) ≈ /2. Legyen most " # " # 2 3 1 2− + 2/ −1 x = (A + ∆ A) b = ≈ . −2 − −2/ 3 3 " # 0 Ekkor r ( x) = Ax −b = . Ezért kr ( x) k∞ / kbk∞ = 2/ + 1, ami nem kicsi. 2/ + 1
17.9. példa. Legyen A 2
=
1
2
1
1
1). Ekkor
2
A legáltalánosabb esetben az Ax
= b egyenlet helyett a perturbált
(A
+ ∆A) x = b + ∆b
(17.21)
egyenletrendszert oldjuk meg. Igaz a következo
k∆Ak k Ak
< 1 és b , 0, akkor k∆Ak k∆bk k∆ xk cond(A) kAk + kbk ≤ . k∆Ak k xk 1 − cond(A) k Ak
17.16. tétel. Ha A nemszinguláris, cond (A)
(17.22)
következik a következo Fenti tételbol Ökölszabály. Tegyük fel, hogy Ax cond(A)
∼ 10t , ahol t <
=
ökölszabály. b. Ha A és b elemei s decimális jegyre pontosak és
s. Ekkor a számított megoldás kb. s
A 17.16. tétel cond(A) k∆ Ak / k Ak hogy az A
+ ∆A
<
− t jegyre lesz pontos.
1 feltételének jelentése szemléletes: azt biztosítja,
mátrix ne legyen szinguláris. A cond(A) k∆ Ak / k Ak
<
1 egyenlotlenség
742
17. Tudományos számítások
ugyanis ekvivalens a
k∆Ak <
1
k A− k 1
feltétellel és az A nemszinguláris mátrix legközelebbi
szinguláris mátrixtól való távolsága éppen 1/ A jellemzését adhatjuk: 1 cond (A)
=
−1
. Ez alapján a kondíciószám egy újabb
k∆Ak . A+∆ A szinguláris k Ak min
(17.23)
Eszerint, ha egy mátrix rosszul kondicionált, akkor közel van egy szinguláris mátrixhoz. Megjegyezzük, hogy mátrixok kondíciószámát az F (x)
=
A
−1
x leképezés kondíciószámá-
becsléseként már korábban is megkaptuk. nak felso deníciót. Vezessük be a következo 17.17. deníció. Egy lineáris egyenletrendszer megoldó eljárást gyengén stabilnak neve-
∈ H mátrix és minden b esetén = b egyenletrendszer x számított megoldásának k x − xk / k xk relatív hibája kicsi.
zünk egy H mátrixosztályon, ha minden jól kondicionált A az Ax
eredményt kapjuk. Ha a 17.1317.16. tételeket összerakjuk, akkor a következo 17.18. tétel (Bunch). Egy lineáris egyenletrendszer megoldó algoritmus gyengén stabil a H mátrixosztályon, ha minden jól kondicionált A
∈
H mátrix és minden b esetén az Ax
=b
egyenletrendszer x számított megoldására fennáll az alábbi feltételek bármelyike: (1)
k x − xk / k xk kicsi;
(2) kr ( x) k / kbk kicsi; (3) Létezik
∆A úgy, hogy (A + ∆A) x = b és k∆Ak / kAk kicsi.
A 17.16. tétel becslését a gyakorlatban akkor tudjuk jól használni, ha ismert
∆b, ∆A és
megoldás hibáját csak utólagocond(A) vagy ezek egy becslése. Ezek hiányában a közelíto san (a posteriori) lehet becsülni. A következokben komponensenkénti hibabecslésekkel foglalkozunk. Elsoként a köze megoldás abszolút hibájára adunk becslést az inverz hibák komponenseinek segítségélíto vel. 17.19. tétel (Bauer-Skeel). Legyen A
∈ Rn×n
Rn ×n , s ∈ Rn és ε >
− ε A 1 S
∞ < 1, akkor
S ∈
=b + E) x = b + e egyenletrendszert. Ha s ≥ 0, | E | ≤ εS , |e| ≤ ε s, valamint
nemszinguláris és tegyük fel, hogy az Ax
egyenletrendszer x közelíto megoldása kielégíti az (A 0 olyanok, hogy S
≥
0,
ε
A−1 (S | x| + s)
∞
. k x − xk∞ ≤ 1 − ε A−1 S
(17.24)
∞
Ha e
= 0 (s = 0), S = |A| és kr (A)
=
A−1 |A|
∞ < 1,
akkor a
k x − xk∞ ≤
1
εkr (A) − εkr (A)
(17.25)
(17.26)
becslést kapjuk. A kr (A) mennyiséget Skeel-féle normának nevezzük, noha a szokásos értelemben nem norma. A Skeel-féle norma kielégíti a kr (A)
≤ cond∞ (A) = kAk∞
A−1
∞
(17.27)
743
17.2. Lineáris egyenletrendszerek
egyenlotlenséget. Tehát a fenti becslés nem rosszabb, mint a hagyományos kondíciószámot használó becslés. Az inverz hiba komponensenkénti becslését teszi lehetové Oettli és Práger eredménye. következo Legyenek adottak az A, δ A
∈ Rn×n
mátrixok és a b, δb
δA ≥ 0 és δb ≥ 0. Legyen továbbá n×n D = ∆A ∈ R : |∆ A| ≤ δ A , 17.20. tétel (Oettli-Práger). (A
G
∈ Rn
vektorok. Tegyük fel, hogy
= {∆b ∈ Rn : |∆b| ≤ δb} .
Egy x számított megoldás akkor és csak akkor megoldása egy
+ ∆A) x = b + ∆b perturbált egyenletrendszernek, ahol ∆A ∈
D és
∆b ∈ G, ha
| = |A x − b| ≤ δ A | x | + δb. |r ( x)
(17.28)
A tétel alkalmazásához nem kell a kondíciószám ismerete. A gyakorlatban
δA
és
δb
elemei a gépi epszilonnal arányosak. 17.21. tétel (Wilkinson). Az Ax
= b egyenletrendszer Gauss-módszerrel lebegopontos arit-
metikában kapott x közelíto megoldása kielégíti az (A
+ ∆A) x = b
(17.29)
egyenletrendszert, ahol
k∆Ak∞ ≤ 8n3 ρn kAk∞ u + O(u2 ),
(17.30)
ρn a pivot elemek növekedési tényezoje és u az egységnyi kerekítés mértéke. Minthogy a gyakorlatban
ρn kicsi, a k∆Ak∞ ≤ 8n3 ρn u + O(u2 ) kAk∞
relatív inverz hiba is az. Ezért a 17.18. tétel alapján a Gauss-elimináció gyengén stabil mind a teljes, mind pedig a parciális foelemválasztás esetén. kapjuk, hogy A Wilkinson tételbol cond∞ (A)
k∆Ak∞ ≤ 8n3 ρn cond∞ (A) u + O u2 . kAk∞
Kis kondíciószám esetén feltehetjük, hogy 1−cond∞ (A) k∆ Ak∞ 17.16. tételek felhasználásával (∆b kapjuk:
=
/ kAk∞ ≈
1. A 17.21. és a
becslést 0 eset) a direkt hibára az alábbi közelíto
k∆ xk∞ ≤ 8n3 ρn cond∞ (A) u . k xk∞
(17.31)
Ez az ökölszabály helyességét támasztja alá a Gauss-módszer esetén. példát, amelynek együtthatóit pontosan tudjuk ábrázolni: 17.10. példa. Tekintsük a következo 888445x1 887112x1
+ 887112x2 = 1, + 885781x2 = 0 .
Itt cond(A)∞ ugyan nagy, de cond∞ (A)k∆ Ak∞ /k Ak∞ elhanyagolható az 1 mellett. A feladat pontos megoldása x1
=
885781, x2
= −887112. A MATLAB által adott közelíto megoldás
x 1
=
885827.23,
744 x 2
17. Tudományos számítások
= −887158.30, amelynek relatív hibája k x − xk∞ = 5.22 × 10−5 . k x k∞
Minthogy s
≈ 16 és cond (A)∞ ≈ 3.15 × 1012 , az eredmény lényegében megfelel a Wilkinson tételnek,
ill. az ökölszabálynak. A Wilkinson tétel az inverz hiba mértékére a
k∆Ak∞ ≤ 1.26 × 10−8 δA = M |A| és δb = M |b| választással alkalmazva kapjuk, hogy −10 | + δb. Minthogy |δ Ak∞ = 3.94 × 10 , ez jobb becslést ad a k∆ Ak∞ inverz hibára, mint | ≤ δA | x |r ( x)
becslést adja. Az Oettli-Práger tételt a a Wilkinson-féle eredmény.
Skálázás és prekondicionálás Számos, gyakorlati alkalmazásban eloforduló mátrix rosszul kondicionált, ha n rendszáma nagy. Ilyen például a
" Hn
Hilbert-mátrix, amelyre cond2 (Hn )
=
1 i
+ j−1
#n (17.32) i, j=1
≈ e3.5n , ha n → ∞. Léteznek olyan egész elemu 2n × 2n
mátrixok is, amelyek a szabványos IEEE754 lebegopontos aritmetikában pontosan ábrázol hatók és amelyek kondíciószáma közelítoleg 4
× 1032n .
módja ismeretes: többA nagy kondíciószámú egyenletrendszerek megoldásának két fo szörös pontosságú aritmetika használata vagy a kondíciószám csökkentése. A kondíciószám csökkentésének két formája is ismert. 1. Skálázás. Az Ax
= b egyenletrendszert helyettesítjük az (RAC) y
= (Rb)
(17.33)
egyenletrendszerrel, ahol R és C diagonális mátrixok. Erre a skálázott egyenletrendszerre alkalmazzuk a Gauss-eliminációt. Ennek y megoldásával kapjuk vissza az x
= Cy megoldást. Ha az RAC mátrix kondíciószáma kisebb, akkor
y hibája is vélhetoen kisebb lesz, így összességében az x pontosabb közelítését is megkaphatjuk. Számos stratégia ismeretes az R és C skálázó mátrixok megválasztására. Az egyik legismertebb stratégia az ún. kiegyensúlyozás, amelynek eredményeként az RAC mátrix valamennyi sora és oszlopa valamilyen normában mérve közel ugyanakkora lesz. Például a
D
1 1 = diag
T
, . . . ,
T
a1 2
an 2
T skálázott mátrix sorainak választás esetén, ahol ai az A mátrix i-edik sorvektorát jelöli, a DA
euklideszi normája azonosan 1 lesz. Erre a skálázásra fennáll, hogy
cond2 DA
ahol D+
=
diag (d1 , . . . , dn )
skálázza az A mátrix sorait.
≤
√
n min cond2 (DA) D∈ D+
| d1 , . . . , dn > 0
,
közelítoleg . Ez azt jelenti, hogy D optimálisan
745
17.2. Lineáris egyenletrendszerek
Tekintettel arra, hogy a skálázás és a foelemkiválasztás együttes hatása esetenként igen példa egy rossz eredményekre vezet, az eljárást újabban ritkán használják. A következo ilyen esetet mutat be. 17.11. példa. Tekintsük az
/2 A = 1 1
mátrixot az 0
1
1
1
1
1
2
< 1 esetben. Igazolható, hogy cond∞ (A) = 12. Legyen √ 0 2/ 0√ . / 2 0 R =C = 0 √ 0 0 /2
Ekkor a skálázott mátrix
RAR =
amelynek kondíciószáma cond∞ (RAR)
=
2
1
1
1
/4 /4
/4 /2
1
32/ . Ez kis
,
esetén nagyon nagy érték. Tehát a skálázás
elrontja a példabeli mátrixot.
2. Prekondicionálás. A prekondicionálás tulajdonképpen a skálázással rokon. A szimmetrikus és pozitív denit mátrixú Ax Ax
alakba, ahol M olyan, hogy cond M
= b egyenletrendszert átírjuk az ekvivalens
= (MA) x =
−1
Mb
= b
(17.34)
legkisebb és könnyu A a leheto megoldani az Mz
=y
alakú egyenletrendszereket. A prekondicionálást általában iteratív módszerekkel együtt használjuk, módszerenként specializált formában. Utólagos hibabecslések megoldás hibájának utólagos becslése azért szükA valamilyen módszerrel kapott közelíto séges, hogy valamilyen támpontunk legyen az eredmény megbízhatóságáról. Az irodalom ban számos módszer ismeretes. Ezek közül ismertetünk három szert. Az
Θ
n
2
Θ
2
n
op költségu mód-
egyszeri költségu becslések ésszeru számítási többletet jelentenek az
költségu direkt módszerekhez képest és elfogadhatók az iteratív módszerek
Θ
n
2
Θ
3
n
iterációs
lépésenkénti számítási költségével szemben is.
A direkt hiba becslése a reziduális segítségével
17.22. tétel (Auchmuty). Jelölje x az Ax
=
b egyenletrendszer valamilyen módon kiszámí-
tott közelíto megoldását. Ekkor igaz, hogy 2 c kr( x) k2
, k x − xk2 =
AT r( x) 2
ahol a hibakonstansnak nevezett c-re c
≥ 1 teljesül.
746
17. Tudományos számítások
Megemlítjük, hogy a c hibakonstans az A-tól függ, de értékét nem befolyásolja az x −x hibavektor nagysága, csak az iránya. Igaz továbbá, hogy C 2 (A)
=
1 2
cond2 (A)
+
1
!
cond2 (A)
≤ cond2 (A) .
C 2 (A) értéket csak kivételes, de egzakt módon megadható A c hibakonstans a felso esetekben éri el. A számítógépes tapasztalatok azt mutatják, hogy c az A mátrix rendjével (n) és jobban függ n-tol, mint A kondíciószámától. A számítógépes tesztelések együtt lassan no statisztikai feldolgozása alapján a
T
2 k2 / A r ( x) k x − xk2 / 0.5 dim (A) kr ( x) 2
(17.35)
becslés nagy tapasztalati valószínuséggel teljesül.
Az
A−1 LINPACK becslése
−1
A becslésére. OldT − 1 juk meg rendre az A y = d, Aw = y egyenletrendszereket. Az A becslése: eljárást A LINPACK programcsomagban használják a következo
−1
kwk
A ≈ kyk
≤ A−1 .
(17.36)
A−1 A−T d
kwk
= , kyk
A−T d
Minthogy
hatványmódszer az eljárás felfogható a sajátértékszámítási fejezetben ismertetésre kerülo alkalmazásának. A becslés az 1, 2 és solt komponensei
∞ normák esetén alkalmazható. A d vektor java ±1 értékuek. Az elojeleket lehet véletlenszeruen választani. A LINPACK
rendszerben az elojelek megválasztása egy adaptív stratégiával történik. Ha az Ax
=
b egyenletrendszert az LU-módszerrel oldottuk meg, akkor a további
egyenletrendszerek megoldása
Θ(n ) op rendszerenként, így a LINPACK becslo eljárás 2
−1 megoldás hibája költsége kicsi marad. Az A becslés segítségével cond(A) és a közelíto
(vö. a 17.16. tétellel, vagy az ökölszabállyal). Megjegyezzük, hogy már könnyen becsülheto más hasonló eljárások is ismertek.
Az inverz hiba Oettli-Práger-féle becslése formában szokás Az inverz hiba becsléséhez az Oettli-Práger eredményt a következo
= A x − ≥ 0. Legyen
használni. Legyen r ( x) hogy E
≥ 0 és
f
b a reziduális hiba, E
∈ Rn×n
és f
∈ Rn
adottak úgy,
i| |r ( x) , + f )i ahol 0/0-át 0-nak, ρ/0-át pedig ∞-nek deniáljuk, ha ρ , 0. Az (y)i jelölés az y vektor iedik komponensét jelöli. Ha ω , ∞, akkor van egy ∆ A mátrix és egy ∆b vektor, amelyekkel
ω = max i
(E | x |
fennáll
|∆A| ≤ ωE ,
|∆b| ≤ ω f
és (A
+ ∆A) x = b + ∆b.
747
17.2. Lineáris egyenletrendszerek
Továbbá
ω
a legkisebb olyan szám, amelyre a fenti tulajdonságú
∆A
és
∆b
létezik. Az
ω
mennyiség az E és f mennyiségekben kifejezett relatív inverz hibát méri. Ha egy adott E, f és x esetén
ω
kicsi, akkor a perturbált probléma is (és ennek megoldása is) közel van
az eredetihez (és ennek megoldásához). A gyakorlatban az E
= |A|,
f
= |b|
választást
preferálják. megoldás iteratív javítása A közelíto
=
Jelölje x az Ax
megoldását. Legyen r(y) b egyenletrendszer közelíto
=
Ay
−
b az y
megoldás pontosságát a következo iteratív eljárással pontbeli reziduális hiba. Az x közelíto lehet javítani. I´-´ , tol) ´ (A, x
←1 ← x d ← ∞
while = d / k xk k > tol do r ← Axk − b
1
k
2
x1
3 4 5 6
számítsuk ki az Ad
← xk − ←k+1
7
xk+1
8
k
9
= r egyenletrendszer d közelíto megoldását LU-módszerrel
d
return xk Az eljárásnak különféle változatai ismertek. Az LU-módszer helyett más módszer is
használható. Legyen
η az a legkisebb relatív inverz hibakorlát, amelyre (A
+ ∆A) x = b + ∆b,
|∆A| ≤ η |A| ,
|∆b| ≤ η |b| .
Legyen továbbá
σ (A, x) = max (|A| | x|)k / min (|A| | x|)k ,
min (| A| | x|)k
k
k
k
>0.
Igaz a következo
−1
17.23. tétel (Skeel). Ha kr A
σ (A, x) ≤
c1
< 1/ M ,
akkor elég nagy k esetén fennáll,
hogy (A
+ ∆A) xk = b + ∆b,
|∆A| ≤ 4η M |A| ,
iteráció után, a k Ez az eredmény gyakran az elso
=
|∆b| ≤ 4η M |b| .
(17.37)
2 értékre teljesül. Jankowski és
φ módszerre = b egyenletrendszer 1-nél kisebb relatív hibájú x közelítését állítja azaz amelyre k x elo, − xk ≤ q k xk (q < 1). Igazolták, hogy az iteratív javítás még egyszeres megoldás pontosságát és a φ pontosságú lebegopontos aritmetikában is javítja a közelíto Wozniakowski az iteratív javítást a Gauss-elimináció helyett tetszoleges olyan vizsgálták, amely az Ax
módszert gyengén stabillá teszi.
Gyakorlatok 17.2-1. Bizonyítsuk be a 17.7. tételt.
748
17. Tudományos számítások
= b és az (ii) Bx = b egyenletrendszert, ahol " # " # 1 1/2 1 −1/2 A = , B= , 1/2 1/3 1/2 1/3
17.2-2. Tekintsük az (i) Ax
b pedig kétkomponensu vektor. A két egyenlet közül melyik érzékenyebb a b perturbációjára? Az érzékenyebb egyenletnél a b -t hányszor kisebb relatív hibával kell ismernünk, hogy ugyanolyan pontossággal határozhassuk meg a megoldást, mint a másiknál? 17.2-3.
−1
χ = 3/229 és ζ = 214 . Oldjuk meg , 10−5 , 10−7 , 10−10 -re, ahol χζ −ζ ζ −1 −1 ζ ζ 0 , b = A = −1 −1 −1 ζ −χζ ζ
Legyen
ε = 10 , 10
−3
az Ax
=
b egyenletrendszert
1+ε . 1 1
Mit tapasztalunk? Adjunk magyarázatot. 17.2-4. Legyen A 10×10-es mátrix és válasszuk prekondicionáló mátrixnak az A foátlójából és két mellékátlójából álló sávmátrixot. Mennyit javul a rendszer kondíciószáma, ha (i) A véletlen mátrix; (ii) A Hilbert-mátrix? 17.2-5. Legyen
A =
1/2
1/3
1/3
1/4
1/4
1/5
1/5 , 1/6 1/4
∈ R3 komponenseinek közös hibakorlátja pedig ε. Adjuk meg az Ax = b egyenletrendT szer [x1 , x2 , x3 ] megoldásának, valamint az (x1 + x2 + x3 ) összeg (minél élesebb) hibakora b
látját. 17.2-6. Tekintsük az Ax
=
megoldása legyen b egyenletrendszert, amelynek egy közelíto
x . (i) Vezessünk le az x -ra hibakorlátot, ha az (A sem A
+ E) x =
b pontosan teljesül és sem A,
+ E nemszinguláris.
(ii) Adjunk (ha lehetséges) A elemeire relatív hibakorlátot, melyen belül maradva nem változik a megoldás egyik komponensének sem az egész része, ha
A =
10
7
8
7
5
6
8
6
10
,
b =
25 18 24
.
17.3. Sajátértékszámítás A mátrixok sajátérték-feladatának megfogalmazásához szükségünk van a komplex elemu mátrixok és vektorok bevezetésére. A komplex elemu n dimenziós oszlopvektorok halmazát
× n típusú komplex elemu mátrixok halmazát Cm×n n m×n jelöli. Nyilvánvalóan fennáll, hogy R ⊂ C és R ⊂ Cm×n . A valós elemu vektorokra és n
C -nel jelöljük. Hasonlóképpen az m
n
mátrixokra bevezetett muveletek és a determináns értelemszeruen ugyanazok maradnak a komplex esetben is.
749
17.3. Sajátértékszámítás
∈ Cn×n tetszoleges mátrix. A λ ∈ C számot az A mátrix sajátérté(x , 0) vektort pedig a λ sajátértékhez tartozó (jobb oldali) sajátvektornak
17.24. deníció. Legyen A kének, az x
∈C
n
nevezzük, ha Ax
= λx .
A sajátvektor egy olyan vektor, amelyet az x
→
(17.38) Ax leképezés a saját hatásvonalán hagy
(irányítás, nagyság változhat). A sajátérték-feladat megoldása a sajátértékek és a hozzájuk tartozó sajátvektorok meghatározását jelenti. Az Ax
= λ x egyenletrendszer átrendezéssel az ekvivalens (A − λI)x = 0 alakra hozható
méretu (I a megfelelo egységmátrix). Ennek a homogén egyenletrendszernek akkor és csak megoldása, ha akkor van nullától különbözo
φ(λ) = det(A − λI) = det
a11
−λ
a21
.. .
an1
... a22 − λ . . . .. .. . . an2 ... a12
= 0 .
a1n a2n
.. . ann − λ
(17.39)
A (17.39) egyenletet az A mátrix karakterisztikus egyenletének nevezzük, melynek gyökei a mátrix sajátértékei. A determinánst kifejtve a
λ változó n-ed fokú polinomját, azaz a
φ(λ) = (−1)n (λn − p1 λn−1 − · · · − pn−1 λ − pn ) karakterisztikus polinomot kapjuk. Az algebra alaptétele miatt az A
∈ Rn mátrixnak, a mul-
tiplicitásokat is beleszámítva, pontosan n sajátértéke van, melyek között lehetnek valósak és komplex konjugált párok. Valós mátrixok komplex sajátértékeit és sajátvektorait valós aritmetika használata esetén csak speciális technikákkal kaphatjuk meg. Ha t
,
0, akkor egy x sajátvektor t-szerese is sajátvektor. Egy
lineárisan független sajátvektorok száma legfeljebb annyi, mint
λk
λk
sajátértékhez tartozó
multiplicitása a (17.39)
sajátértékekhez tartozó sajátvektorok lineárisan függetlenek. egyenletben. A különbözo két tétel. A sajátértékek nagyságát és geometriai elhelyezkedését jellemzi a következo 17.25. tétel. Legyen mában fennáll, hogy
λ az A mátrix |λ| ≤ kAk.
17.26. tétel (Gersgorin). Legyen A
ri
=
tetszoleges sajátértéke. Tetszoleges indukált mátrixnor-
∈ Cn×n , n X ai j
(i
= 1, . . . , n)
j=1, j,i
és Di Ekkor az A mátrix minden
= {z ∈ C| |z − aii | ≤ ri }
(i
= 1, . . . , n) .
λ sajátértékére fennáll, hogy λ ∈ ∪ni=1 Di .
Például, ha A háromszögmátBizonyos mátrixok esetén a (17.39) megoldása egyszeru. rix, akkor kiolvasható, hogy a sajátértékek a foátlóbeli elemek. A legtöbb esetben azonban az összes sajátérték és sajátvektor meghatározása elvileg is komoly gondokat okoz. Ezért is van gyakorlati jelentosége az olyan transzformációknak, melyek a sajátértékeket változatla nul hagyják. Mint késobb látni fogjuk, az ilyen transzformációk sorozatával nyert új mátrix sajátértékfeladata egyszerubben kezelheto.
750
17. Tudományos számítások
× n méretu A és B mátrix hasonló, ha van egy T mátrix úgy, = T −1 AT . Az A → T −1 AT leképezést hasonlósági transzformációnak nevezzük.
17.27. deníció. Az n B
17.28. tétel. Tegyük fel, hogy az n B
=
T
−1
× n méretu T
mátrixra det(T )
hogy
, 0 teljesül. Ekkor az A és = T −1 x a B
AT mátrix sajátértékei megegyeznek. Ha x az A sajátvektora, akkor y
sajátvektora. A tétel tartalma az, hogy hasonló mátrixok sajátértékei megegyeznek. A sajátérték feladat nehézségét tovább fokozza az a tény, hogy a sajátértékek és sajátvektorok a mátrixelemek megváltozására ezért a számítás közbeni kerekítési hibákra is nagyon érzékenyek. Az eredeti A mátrix és a perturbált A + δ A mátrix sajátértékei jelentosen eltérhetnek egymástól és a sajátértékek multiplicitása is megváltozhat. A sajátérték-feladat tételekkel és példákkal jellemezhetjük. érzékenységét a következo 17.29. tétel (Ostrowski-Elsner). perturbált A
Az A
+ δA mátrix egy olyan µk
∈
n×n
C
mátrix minden
λi
sajátértékéhez létezik a
sajátértéke, hogy 1
|λi − µk | ≤ (2n − 1) (kAk2 + kA + δAk2 )1− kδAk2 . 1
n
n
A tétel azt mutatja, hogy a sajátértékek folytonosan változnak és azt, hogy a megváltozás mértéke arányos a
δA perturbáció mértékének n-edik gyökével.
17.12. példa. Vizsgáljuk meg egy cióját:
µ sajátértékhez tartozó r × r méretu Jordan-mátrix alábbi perturbá
µ
1
0
µ .. .
.. .
1
..
.
..
0
0
0
. ...
... .. . .. . µ 0
.. . . 0 1 µ 0
A perturbált mátrixhoz tartozó karakterisztikus egyenlet (λ mátrix r-szeres
− µ)r = ,
ahonnan az eredeti Jordan-
µ sajátértéke helyett az r különbözo λ s = µ + 1/r (cos (2sπ/r) + i sin (2sπ/r))
(s
= 0, . . . , r − 1)
1/r sajátértéket kapjuk. A sajátértékek megváltozásának mértéke , amely megfelel a 17.29. tétel állítá|µ| ≈ 1, r = 16 és = M ≈ 2.2204 × 10−16 értékeket vesszük, akkor a sajátértékek
sának. Ha például eltérése
mértéku ≈ 0.1051. Ez pedig a mátrix perturbációjához képest a sajátértékek egy igen jelentos
megváltozását jelenti.
Speciális tulajdonságú mátrixok és perturbációk esetén a sajátértékek megváltozása az Ostrowski-Elsner tételben látottnál jóval kisebb is lehet.
∈ Cn×n diagonalizálható mátrix, azaz létezzen olyan X = diag(λ1 , . . . , λn ). Jelölje µ az A + δA mátrix sajátértékét. Ekkor
17.30. tétel (Bauer-Fike). Legyen A mátrix, hogy X
−1
AX
min
1≤i≤n
|λi − µ| ≤ cond2 (X) kδAk2 .
(17.40)
751
17.3. Sajátértékszámítás
Tehát diagonalizálható mátrix perturbációja esetén a sajátértékek megváltozásának mértéke arányos az általában ismeretlen X mátrix kondíciószámával és
kδAk2 -val.
Ez aszimp-
totikusan lényegesen jobb eredmény, mint az Ostrowski-Elsner tétel, azonban ne felejtsük, hogy cond2 (X) igen nagy is lehet. Az A mátrix sajátértékei folytonos függvényei a mátrix elemeinek. Ez a normált saját példa is mutatja, hogy az vektorokra is igaz, ha a sajátértékek egyszeresek. A következo utóbbi állítás többszörös sajátértékek esetén már nem igaz. 17.13. példa. Legyen
" A (t)
=
1
+ t cos (2/t) −t sin (2/t)
−t sin (2/t) 1 − t cos (2/t)
# (t
, 0) .
λ1 = 1 + t és λ2 = 1 − t. A λ1 sajátértékhez tartozó λ2 -höz tartozó pedig [cos (1/t) , − sin (1/t)]T . Ha t → 0, akkor " # 1 0 A (t) → I = , λ1 , λ2 → 1 ,
Az A (t) mátrix sajátértékei [sin (1/t) , cos (1/t)] , a T
0
sajátvektor
1
míg a sajátvektor sorozatnak nincs határértéke.
alfejezetben a feladat közelíto megoldásával foglalkozunk. Sajnos, a köA következo zelítések jóságát igen nehéz megítélni, ugyanis abból, hogy a deníciós egyenlet milyen pontossággal teljesül, egyéb információk hiányában általában semmire nem következtethetünk. 17.14. példa. Tekintsük az
" A ( )
mátrixot, ahol
≈
=
1
1
1
#
0 kicsi. Az A ( ) mátrix sajátértékei 1
sajátérték közelítése
µ = 1, a sajátvektoré pedig
±
√
,
sajátvektorai [1, ±
√
]T .
Legyen a
= [1, 0] . Ekkor
" #
0
= . kAx − µ xk2 =
x
T
2
Ha most például
= 10−10 , akkor a reziduális öt nagyságrenddel alulbecsüli a tényleges 10−5
hibát.
17.31. megjegyzés. Mátrixok kondíciószámához hasonlóan sajátértékek kondíciószáma is bevezetheto, ami egyszeres sajátérték esetén
ν ( λ1 ) ≈
k xk2 kyk2 , x T y
ahol x és y a jobb, illetve bal oldali sajátvektor (komplex sajátérték esetén x
T
helyett az ún.
hermitikus transzponáltat vesszük). Többszörös sajátérték kondíciószáma nem véges. Itt is arról van szó, hogy a sajátérték közelítés relatív hibája a relatív reziduális hiba kondíciószámszorosa.
17.3.1. A sajátérték feladat iteratív megoldása Csak valós elemu mátrixok valós sajátértékeit és sajátvektorait vizsgáljuk. A módszerek a komplex esetre is. értelemszeru módosításokkal kiterjeszthetok
752
17. Tudományos számítások
A hatványmódszer
×n λ1 , . . . , λn
származó módszer alapgondolata a következo. Tegyük fel, hogy az n A von Mieses-tol valós sajátértéke van. Ekkor a méretu A valós mátrixnak pontosan n különbözo
sajátértékekhez tartozó x1 , . . . , xn sajátvektorok lineárisan függetlenek. Tegyük fel, hogy a sajátértékek kielégítik a
|λ1 | > |λ2 | ≥ . . . ≥ |λn | (0) ∈ Rn adott. A sajátvektorok lineáris függetlensége miatt v(0) egyértel= α1 x1 + α2 x2 + . . . + αn xn alakban. Tegyük fel, hogy α1 , 0. Képezzük a = Ak v(0) (k = 1, 2, . . .) sorozatot. A kiinduló feltevések miatt
feltételt és legyen v muen eloáll v
=
(k)
v
Av
(k−1)
(0)
=
(k)
v
Av
(k−1)
k−1 x1 1 k x1 2 1
+ α2 λk2−1 x2 + · · · + αn λkn−1 xn ) α1 λ + α λk2 x2 + · · · + αn λkn xn k k λk1 α1 x1 + α2 λλ x2 + · · · + αn λλ xn .
= =
A(α1 λ
= ∈ Rn
Legyen y
2
n
1
1
, 0. Ekkor k+1 P T λk1+1 α1 yT x1 + ni=2 αi λλ y xi → λ1 . = k P λk1 α1 yT x1 + ni=2 αi λλ yT xi T
tetszoleges olyan vektor, amelyre y x1
T
y Av
(k)
T
=
yT v(k)
y v
(k+1)
yT v(k)
i
1
i
1
∈ Rn
(0)
Av
kezdovektor felhasználásával a hatványmódszer a következo:
H (A, v ´ ´
(0)
)
←0
1
k
2
while kilépési feltétel
4
= ←k+1 (k) z ← Av(k−1)
5
válasszunk y vektort úgy, hogy y v
3
6 7 8
do k
T
(k−1)
, 0 teljesüljön
(k−1)
γk ← y z / y v (k) v ← z(k) /
z(k)
∞ (k) return γk , v (k)
T
T
A fentiek alapján fennáll, hogy (k)
v (k)
A v
→
→
x1 ,
γ k → λ1 . (k)
x1 konvergencián itt azt értjük, hogy v
hatásvonala Az
x 1 hatásvonalához. tart
(k)
y vektort általában egységvektornak választjuk úgy, hogy ha vi y
=
ei . Ha az y
(k−1)
=
(k−1)
v
választást használjuk, akkor
(k−1)
γk =
=
v(k)
, akkor legyen ∞ (k−1) Av / v(k−1)T v(k−1) a
(k−1)T
v
vektorhoz tartozó, ún. R v Rayleigh-hányadossal azonos. Ez a választás adja a λ1 sajátérték minimális reziduális hibájú közelítését (ami a 17.14. példa alapján persze nem
v
jelenti azt, hogy a legjobb választás lenne). Az eljárás konvergencia sebessége a (0)
keny a v
érzé|λ2 /λ1 | nagyságától függ. A módszer erosen α1 = 0, akkor az eljárás nem konvergál a λ1
kezdovektor megválasztására is. Ha
domináns sajátértékhez. Bizonyos mátrixosztályok esetén igazolták, hogy véletlenül válasz(0)
tott v
kezdovektorok esetén 1 valószínuséggel konvergál az eljárás. Komplex sajátértékek,
753
17.3. Sajátértékszámítás
λ1 esetén az eljárást módosítani kell. Az eljárás konvergenciáját gyorsí− σI ún. eltolt mátrixra alkalmazzuk, ahol σ alkalmasan megválasztott konvergenszám. Az A − σ I mátrix sajátértékei ui. λ1 − σ, λ2 − σ, . . . , λn − σ és a megfelelo |λ2 − σ| / |λ1 − σ|. Ez utóbbi σ ügyes megválasztásával kisebbé teheto, mint cia tényezo: |λ2 /λ1 |.
illetve többszörös
tani lehet, ha az A
A hatványmódszert az
Av(k) − γk v(k)
2 krk k2
≤ kEk k2 =
=
v(k) 2
v(k) 2
kilépési feltétellel szokás leállítani. Ha a hatványmódszert szimultán alkalmazzuk az A mátrixra és wk
=
T
A
k
w0 , akkor
w(k)
2
v(k)
2 ν ( λ1 ) ≈ wT v k
λ1
a
T
k
kondíciószámának (lásd a 17.31. megjegyzést) egy becslését adja. Ekkor értelemsze-
ruen a
ν (λ1 ) kEk k2 ≤ kilépési feltételt használjuk. A hatványmódszert, amely igen elonyös lehet nagyméretu ritka mátrixok esetén, leginkább a legnagyobb, ill. a legkisebb abszolút értéku sajátértékek meghatározására használjuk. Ez utóbbi a következoképpen történhet. Az A
−1
sajátértékei: 1/λ1 , . . . , 1/λn . Ezek közül a
legnagyobb abszolút értéku sajátérték 1/λn lesz. Ezt az értéket tehát a hatványmódszernek
−1
A
-re való alkalmazásával megkaphatjuk, mégpedig úgy, hogy algoritmusának 4-edik sorát
utasításra cseréljük: a következo (k)
oldjuk meg az Az
= v(k−1) egyenletrendszert z(k) -ra.
Az így módosított algoritmust nevezzük inverz hatványmódszernek. Nyilvánvaló, hogy alkalmas feltételek mellett
γk → 1/λn
(k)
és v
→
(k)
xn . Az Az
=
(k−1)
v
egyenletrendszer
elonye, megoldásához az LU-módszert célszeru használni. Az algoritmus szembetun o hogy nem kell A
−1
-et meghatározni.
− µI mátrixra alkalmazzuk, akkor (A − µI)−1 µ közelít, mondjuk λt -hez, akkor λi − µ → λi − λt . Ezért az eltolt
Ha az inverz hatványmódszert az eltolt A sajátértékei (λi
−
µ)−1 . Ha
mátrix sajátértékeire teljesül, hogy
|λt − µ|−1 > |λi − µ|−1
(i
, t) .
A konvergencia sebességét pedig a q hányados határozza meg. Ha
µ
= |λt − µ| / {max |λi − µ|}
elég közel van
λt -hez,
akkor q kicsinysége miatt az inverz
hatványiteráció rendkívül sebesen fog konvergálni. Ezt a tulajdonságot használhatjuk ki kö-
µ közelítése ismert. Ekkor feltéve, − µI) , 0, az A − µI mátrixra alkalmazzuk az inverz hatványmódszert. Annak (k) ellenére, hogy A − µ I közel szinguláris mátrix és ezért (A − µ I) z = v(k) nem oldható meg sajátvektorok meghatározásánál, ha egy sajátérték zelíto hogy det (A
nagy pontossággal, az eljárás sok esetben igen jó sajátvektor közelítést ad. eljárásokkal és egyéb módosításokkal Végül megjegyezzük, hogy rangszámcsökkento az összes sajátérték-sajátvektor meghatározására is. a Mieses-eljárás alkalmassá teheto
754
17. Tudományos számítások
Ortogonalizálási eljárások denícióra és tételre: Szükségünk van a következo 17.32. deníció. Egy Q
∈ Rn×n
T
mátrix ortogonális, ha Q Q
17.33. tétel (QR-felbontás). Minden A függetlenek, felbontható A
=
∈ Rn×m
=
I.
mátrix, amelynek oszlopvektorai lineárisan
QR alakban, ahol Q ortogonális mátrix és R felso háromszög-
mátrix.
A QR-felbontást az LU-felbontáshoz hasonlóan felhasználhatjuk lineáris egyenletrendszer megoldására is. Ha ismert az A nemszinguláris mátrix QR-felbontása, akkor Ax QRx
=
b
⇔
Rx
=
=
T
háromszögmátrixú egyenletrendszert kell Q b miatt csak egy a felso
megoldani. Egy mátrix QR-felbontására több módszer is létezik. A gyakorlatban a Givens- és Householder-módszereket , valamint az MGS-módszert használják. Az MGS- vagy módosított GramSchmidt-eljárás az önmagában is rendkívül fontos klasszikus GramSchmidt (CGS) ortogonalizációs eljárás numerikusan stabilizált, ekvivalens változata. Maga a feladat: az n a1 , . . . , am
∈ Rn (m ≤ n), lineárisan független vektorok o által kifeszített L {a1 , . . . , am } = λ a | λ ∈ R, j = 1 , . . . , m lineáris altérnek keresj j j j= 1 sük egy ortonormált új bázisát, azaz olyan lineárisan független q1 , . . . , qm vektorokat, amePm
lyekre fennáll: T
qi q j
=0
(i
,
j) , kqi k2
=1
(i
= 1, . . . , m)
és L {a1 , . . . , am }
=
L {q1 , . . . , qm }
.
m
A {qi }i=1 vektorrendszert ortonormált rendszernek mondjuk. A Gram-Schmidt eljárás alap gondolata a következo: Legyen r11
= ka1 k2
és q1
=
a1 /r11 . Tegyük fel, hogy a q1 , . . . , qk−1 vektorokat
P = ak − kj=−11 r jk q j alakban úgy, hogy q k ⊥qi , Pk−1 T T T (i = 1, . . . , k − 1) teljesüljön. Kihasználva, hogy a azaz q qi = a qi − r jk q j qi = 0 j=1 k k T (i = 1, . . . , k − 1) eredményt. Véq1 , . . . , qk−1 ortonormált rendszer, kapjuk az rik = a qi k gül normáljunk: qk = q k / kq k k2 . n Az a1 , . . . , am ∈ R lineárisan független vektorokra (m ≤ n) tehát az eljárást a következo már eloállítottuk. Keressük a q k vektort q k
formában algoritmizálhatjuk. CGS--GS- ´ ´ (m, a1 , . . . , am ) 1 2 3 4 5 6 7
← 1 to m ← 1 to k − 1 T do rik ← a ai k ak ← ak − rik ai rkk ← kak k2 ak ← ak /rkk return a1 , . . . , am for k
do for i
755
17.3. Sajátértékszámítás
Az eljárás felülírja az ai vektorokat az ortonormált qi vektorokkal. A QR-felbontással való kapcsolatot az ak
=
Pk−1 j=1
r jk q j
a1 a2 a3
am
= = = .. . =
+ rkk qk
összefüggés adja meg. Ugyanis fennáll, hogy
q1 r11 q1 r13
+ q2 r22 + q2 r23 + q3 r33
q1 r1m
+ q2 r2m + . . . + qm rmm
q1 r12
.
Másképpen
r11 0 0 A = [a1 , . . . , am ] = q1 , . . . , qm | {z } .. . 0 |
.. .
... ... ... .. .
0
...
r12
r13
r22
r23
0
r33
.. .
0
{z
r2m r3m = .. . rmm } r1m
QR
.
A numerikusan stabilizált MGS módszer a következoképpen adható meg. CGS- ´ ´-GS- ´ ´ (m, a1 , . . . , am ) 1 2 3 4 5 6 7
← 1 to m ← kak k2 ak ← ak /rkk for j ← k + 1 to m T do rk j ← a j ak a j ← a j − rk j ak return a1 , . . . , am
for k
do rkk
Az eljárás felülírja az ai vektorokat az ortonormált qi vektorokkal. Az MGS eljárás ekvivalens a CGS eljárással. Ugyanakkor numerikusan lényegesen stabilabb. Björck igazolta, mátrixra fennáll, hogy hogy m = n esetén a számított Q T Q Q
= I + E,
kE k2 cond (A) u,
ahol u az egységnyi kerekítés mértéke. A QR-módszer A ma használt legfontosabb általános eljárás az összes sajátérték meghatározására. Megmu-
=
tatható, hogy a hatványmódszer általánosítása. Alapgondolata: az A1 olyan Ak+1 gonális hasonlósági transzformációkkal állítsunk elo
=
Q
−1 k
A-ból indulva orto-
Ak Qk
=
T k
Q Ak Qk so-
rozatot, melynek alsó háromszögrésze diagonálmátrixhoz konvergál; foátlóbeli elemei tehát az A sajátértékeihez. A QR-módszernek nevezett eljárásban Qk az Ak ortogonális tényezo. Ekkor Ak+1 szereplo
=
T k
Q (Qk Rk )Qk
= Rk Qk .
=
Qk Rk -felbontásában
756
17. Tudományos számítások
QR- (A) ´
←1 ←A
1
k
2
A1
3
while kilépési feltétel
4
felbontást
← Rk Q k k ← k+1
5
Ak+1
6 7
= HAMIS = Q k Rk
do számítsuk ki az Ak
return Ak tétel. Igaz a következo
17.34. tétel (Parlett). Ha az A mátrix diagonalizálható, továbbá sajátértékeire fennáll
|λ1 | > |λ2 | > · · · > |λn | > 0 és az X
−1
AX
=
diag(λ1 , λ2 , . . . , λn ) hasonlósági transzformáció X mátrixának létezik LU-
felbontása, akkor az Ak mátrixok alsó háromszög része konvergál egy diagonális mátrixhoz, amelynek diagonális elemei az A sajátértékei lesznek.
része nem feltétlenül konvergál egy meghatározott mátrixhoz. Ha Az Ak mátrixok felso az A mátrixnak p számú azonos abszolút értéku sajátértéke van, akkor az Ak mátrixok alakja bizonyos feltételek mellett a
× 0 0 0
..
. × 0
∗ .. .
···
∗
···
∗ .. . ∗ 0
× ..
0
alakhoz közelít, ahol a
∗
.
0
× ×
(17.41)
elemekkel jelölt részmátrix elemei ugyan nem konvergálnak, de
sajátértékei igen. Ezt a részmátrixot lehet azonosítani és alkalmas módon kezelni. Ha valós mátrixunk van, akkor a karakterisztikus egyenletnek valós vagy komplex konjugált gyökei Tehát az Ak sorozat a most lehetnek. Komplex konjugált gyökpárok esetén p legalább ketto. vázolt jelenséget fogja mutatni. A QR-felbontás nagyon számításigényes, költsége módszert
rendkívül
Hessenberg-alakú.
gazdaságosan
lehet
alkalmazni,
Θ(n3 ) ha
a
op. Ugyanakkor a QRkiinduló
A
mátrix
felso
757
17.3. Sajátértékszámítás
17.35. deníció. Egy A
∈ Rn×n
A =
mátrix felso Hessenberg-alakú, ha
...
a11
a1n
a21 0
a32
.. .
0
.. . ..
.
..
. ...
0
an−1,n−2
an−1,n−1
an−1,n
0
an,n−1
ann
.
Az A mátrixból hozzá hasonló, de már Hessenberg-alakú mátrixot többféleképpen is eloállíthatunk. Az egyik legolcsóbb, kb. 5/6n op költségu eljárás a Gauss-elimináción ala3
Hessenberg-alakú mátrix QR-felbontása pul. Mivel egy felso
Θ(n2 ) op számítási költséget
tétel biztosítja, hogy ha A felso Hessenberg-alakú, akkor valamennyi igényel és a következo lépéseként a felso Hessenberg-alakra transzformálást Ak is az, érdemes az algoritmus elso elvégezni.
17.36. tétel. Ha A felso Hessenberg-alakú és A
=
QR, akkor RQ is felso Hessenberg-alakú.
A QR-módszer konvergenciája a hatványmódszerhez hasonlóan a sajátértékek
|λi+1 /λi |
hányadosaitól függ. Minthogy az A−σ I mátrix sajátértékei λ1 −σ, λ2 −σ, . . . , λn −σ, az ehhez kapcsolódó sajátérték hányadosok: |(λi+1
− σ) / (λi − σ)|. A σ ügyes megválasztásával ezek
a hányadosok kicsivé tehetok, meggyorsítva ezáltal a konvergenciát. A Hessenberg-alakra hozást és az eltolást is alkalmazó QR-módszer algoritmusa a következo: E -QR- (A) ´ ´
2
← U −1 AU k ← 1
3
while kilépési feltétel
1
H1
= HAMIS − σk I = Hk+1 ← Rk Qk + σk I k ← k+1
4
do számítsuk ki a Hk
5 6 7
Hessenberg-alakú) (H1 felso
Qk Rk felbontást
return Hk A gyakorlatban a QR-módszert csak eltolásos formában használjuk. A
σi
paraméterek
megválasztására különféle stratégiák léteznek. A leggyakrabban javasolt választás a követ kezo:
(k) σk = hnn
Hk
=
h
(k)
hi j
in
i, j=1
.
Az A sajátvektorai a QR-módszer segítségével többféleképpen is könnyen meghatározhatók. Ezek részletezése az irodalomban megtalálható.
Gyakorlatok 17.3-1. Alkalmazzuk a hatványmódszert az A tékkel. Mi a huszadik lépés eredménye?
" =
1
1
0
2
#
" (0)
mátrixra a v
=
1 1
# kezdoér-
758
17. Tudományos számítások
17.3-2. Alkalmazzuk a hatványmódszert, az inverz hatványmódszert és a QR-módszert a
−4 −3 3 2 4
2
−7 2 7
mátrixra. o gyakorlat mátrixára egy rögzített 17.3-3. Alkalmazzuk az eltolásos QR-módszert az eloz
σi = σ értékkel.
17.4. Numerikus programkönyvtárak és szoftvereszközök algoritmusok számítógépi megA tudományos és mérnöki feladatok megoldásához vezeto valósítására, hatékony kódok írásának támogatására sokféle eszközt fejlesztettek ki. A fej lesztések egyik célja, hogy a programozókat tehermentesítsék a sokszor eloforduló prob lémák kódjainak megírásától. Vannak gyakran eloforduló feladatok, ezekre biztonságos, szabványos rutinok készülnek, amelyek nyilvános programkönyvtárakból lejól muköd o, tölthetok. A fejlesztések egy másik iránya, hogy programozási nyelvként is funkcionáló, olyan szoftvereket hozzanak létre, amelyek segítségével algoritmusok kódolása egyszeruen, gyorsan történhet. A lineáris algebrai szubrutin-gyujtemény mellett megemlítjük a VISUAL NUMERICS (ez a régebbi, IMSL könyvtárból alakult) és a NAG könyvtárakat.
17.4.1. Szabványos lineáris algebrai szubrutinok A BLAS (Basic Linear Algebra Subprograms) programcsomagok alapgondolata a gyak ran eloforduló mátrix-vektor muveletek hatékony implementálása és szabványosítása. A BLAS rutinokat eredetileg FORTRAN nyelven publikálták, de szabványos jellegük miatt számos számítógépen és programkönyvtárban optimalizált gépi kódú rutinként is elérhetok. A BLAS rutinoknak három szintje létezik: - BLAS 1 (1979), - BLAS 2 (1988), - BLAS 3 (1989). Az egyes szintek az implementált mátrixmuveletek muveletigény nagyságrendjének felelnek meg. A BLAS 1-3 rutinok az adott muveletek legjobb vagy legjobbnak tartott algoritmikus megvalósításait tartalmazzák. Az egyes algoritmusok és szintek helyes megválasztása nagymértékben befolyásolja az adott program hatékonyságát. A BLAS rutinoknak létezik ún. sparse-BLAS változata is ritka mátrixok kezelésére. Megjegyezzük, hogy a BLAS 3 rutinokat foként blokkosított párhuzamos algoritmusokhoz fejlesztették ki. A BLAS rutinokat használva épülnek fel a LINPACK, EISPACK és LAPACK szabványosított lineáris algebrai programcsomagok. A LAPACK tartalmazza a párhuzamosított változatok pedig a SCALAPACK csomagban találhatók. az elobbi kettot, Az említett programok megtalálhatók a NETLIB nyilvános programkönyvtárban, amelynek címe:
http:/www.netlib.org/index.html
759
17.4. Numerikus programkönyvtárak és szoftvereszközök
BLAS 1 rutinok
α ∈ R, x, y ∈ Rn . A BLAS 1 rutinok a legfontosabb vektormuveleteket (z = α x, z = T x + y, dot = x y), az k xk2 kiszámítását, változócseréket, forgatásokat, valamint a rendkívül
Legyen
gyakran eloforduló ún. saxpy muveletet tartalmazzák, amelyet z deniál. A saxpy betuszó jelentése: algoritmus valósítja meg:
= αx + y
scalar alpha x plus y. A saxpy muveletet a következo
S(α, x, y)
← elemek [x] ← 1 to n do z [i] = α x [i] + y [i]
1
n
2
for i
3 4
return z A saxpy szoftver eredetu muvelet. A BLAS 1 rutinok muveletigénye
BLAS 2 rutinok A BLAS 2 szint mátrix-vektor muveletei y
= αAx + βy, y =
=
Ax, y
A
−1
x, y
=
T
Θ
Θ (n) op.
A x, A
2
n
←
op igényuek. Az idetartozó muveletek A
+ xyT
és ezek variánsai. Bizonyos mu
veletekben csak háromszögmátrixok szerepelhetnek. Két muvelettel kell részletesen foglal vagy diadikus szorzat módosítási muvelet koznunk. A külso A
←
A
+ xyT
A
∈ Rm×n , x ∈ Rm , y ∈ Rn
kétféleképpen is megvalósítható. Soronkénti vagy
i j változat:
D-- ´ ´ ´ -
← sorok[A] ← 1 to m do A [i, :] ←
1
m
2
for i
3 4
A [i, :]
- (A, x, y) ´
+ x [i] yT
return A
A : jelölés az összes megengedett indexet jelöli. Esetünkben az 1 mazt, azaz A [i, :] az A mátrix teljes sorát. Oszloponkénti, vagy
≤
n indexhal-
- (A, x, y) ´
← oszlopok[A] ← 1 to n do A :, j ← A :, j + y j x
1
n
2
for j
4
j
ji változat:
D-- ´ ´ ´ -
3
≤
return A
Itt A :, j az A j-edik oszlopát jelöli. Vegyük észre, hogy mindkét változat saxpy alapú.
760
17. Tudományos számítások
A gaxpy muvelet a z
= y + Ax
x
∈ Rn , y ∈ Rm , A ∈ Rm×n
muvelet elnevezése. A szintén szoftver eredetu gaxpy muvelet a
general A x plus y ki fejezés rövidítése. A helyesen programozott gaxpy muvelet általában elonyösebb a külso szorzat módosítási muveletnél, ezért ennek használatára kell törekedni. A gaxpy muveletet megvalósító algoritmus sémája a következo: G(A, x, y)
4
← oszlopok[A] ←y for j ← 1 to n do z ← z + x j A :, j
5
return z
1
n
2
z
3
Vegyük észre, hogy oszloponként történik a számítás és a gaxpy muvelet tulajdonképpen általánosított saxpy. BLAS 3 rutinok Ide tartoznak az C
Θ
3
n
muveletigény u mátrix-mátrix, mátrix-vektor muveletek, úgymint az
← αAB + βC, C ← αABT + βC, B ← αT −1 B (T
háromszögmátrix), valamint ezek külön-
féle variánsai. A BLAS 3 szint muveleteit számos formában lehet algoritmizálni. Például a C B
=
∈R
AB mátrixszorzást legalább háromféleképpen tudjuk elvégezni. Legyen A
r ×n
∈
m×r
R
,
.
M ´ ´ -(A, B)
8
← sorok[A] ← oszlopok[A] n ← oszlopok[B] C [1 : m, 1 : n] ← 0 for i ← 1 to m do for j ← 1 to n do for k ← 1 to r do C i, j ← C i, j + A [i, k] B k, j
9
return C
1 2 3 4 5 6 7
m r
Az algoritmus ci j -t az A mátrix i-edik sorának és a B mátrix j-edik oszlopának skalár szorzataként számítja ki (tulajdonképpen a deníciónak megfeleloen). Legyen most A, B, C oszloponként particionálva, azaz
= [a1 , . . . , ar ] B = [b1 , . . . , bn ] C = [c1 , . . . , cn ] A
Ekkor fennáll, hogy cj
=
r X
bk j ak k=1
(j
∈ Rm ) , r (bi ∈ R ) , m (ci ∈ R ) .
(ai
= 1, . . . , n) .
17.4. Numerikus programkönyvtárak és szoftvereszközök
761
saxpy muveleTehát c j az A oszlopainak lineáris kombinációja. A szorzat pedig felépítheto tek sorozatával. M ´ ´ -(A, B)
8
← sorok[A] ← oszlopok[A] n ← oszlopok[B] C [1 : m, 1 : n] ← 0 for j ← 1 to n do for k ← 1 to r do for i ← 1 to m do C i, j ← C i, j + A [i, k] B k, j
9
return C
1 2 3 4 5 6 7
m r
ekvivalens formája mutatja, hogy ténylegesen gaxpy alapú A jki-algoritmus következo eljárás. M (A, B) ´ ´ --´ ´
5
← sorok[A] ← oszlopok[B] C [1 : m, 1 : n] ← 0 for j ← 1 to n do C :, j = gaxpy
6
return C
1 2 3 4
m n
Tekintsük most az A
A , B :, j
, C :, j
= [a1 , . . . , ar ] (ai ∈ Rm ) és T b1 . .. (bi ∈ Rn ) B = T
br
particionálásokat. Ekkor C
=
AB
=
Pr
k=1
T k
ak b
.
M ´ ´ - ¨ -(A, B)
8
← sorok[A] ← oszlopok[A] n ← oszlopok[B] C [1 : m, 1 : n] = 0 for k ← 1 to r do for j ← 1 to n do for i ← 1 to m C i, j ← C i, j + A [i, k] B k, j
9
return C
1 2 3 4 5 6 7
m r
ciklus egy saxpy muveletet A belso valósít meg, amennyiben ak többszörösét a C mátrix j-edik oszlopához adja.
762
17. Tudományos számítások
17.4.2. Matematikai szoftverek integrált Ezen címszó alatt azon eszközöket értjük, melyek segítségével programfejlesztoi környezetben, rendkívül könnyen, tömör formában írhatunk programokat. Elsosorban mate matikai feladatok kódolására fejlesztették ezeket, de olyan bovítésen mentek keresztül, hogy az élet számtalan területén alkalmazhatók. Például, a Nokia cégnél a mobiltelefonok alkat részeinek automatikus tesztelését, minoségellen orzését MATLAB programokkal vezérlik. alfejezetben adunk rövid ismertetést, mellette megemlítjük A MATLAB-ról a következo még a széles körben elterjedt MAPLE, a DERIVE és a MATEMATICA nevu szoftvereket is. A MATLAB kapta nevét. A név A MATLAB matematikai szoftver a MATrix LABoratory kifejezésbol el benne. A kezdeti arra utal, hogy a mátrixszámítások rendkívül egyszeruen végezhetok változataiban egyetlen adattípust ismert: a komplex elemu mátrixot. A késobbi verziókban már megjelentek a magasabb dimenziójú tömbök, cellák, a rekord típusú adatok és az ún. szintu objektumok. Könnyen tanulható és kezdo ismeretekkel is viszonylag bonyolult prog ramozási feladatok megoldását teszi lehetové. A mátrix muveletek kódolása a szokásos matematikai alakban történik. Például, ha A és B két azonos méretu mátrix, akkor az összegüket a C
=
A
+
B utasítással írhatjuk elo.
más progTulajdonképpen csak négy utasítást tartalmaz, mindegyik szemantikája ismeros ramozási nyelvekbol: aZ
= ki f e jezes ´ alakú egyszeru értékadást,
az if kifejezés, utasítások {else/elseif utasítások} end alakú feltételes utasítást, a for ciklusváltozó értékeinek megadása, utasítások end alakú taxatív ciklust és a while kifejezés, utasítások end alakú iteratív ciklust. Rendkívül sok beépített függvény segíti az egyes részfeladatok elvégzését, csak szemelvényszeruen sorolunk fel néhány jellegzeteset: max(A) az A minden oszlopából kiválasztja a legnagyobb elemet, [v, s]
=eig(A) az A sajátértékeit és sajátvektorait adja vissza, az = b egyenletrendszert megoldását.
A\b utasítás pedig az Ax
Igen hatékonyan lehet a mátrixokkal elemenként is muveleteket végezni és kihasználni a mátrix particionálási lehetoségeket. Például a A([2, 3], :)
= 1./A([3, 2], :)
utasítás felcseréli az A mátrix 2-ik és 3-ik sorát, miközben ezen sorok minden elemének a reciprokát veszi. kívántunk adni a lehetoségekb A fenti példákkal csak ízelítot ol, illetve bemutatni, hogy a rendelkezésre álló eszközökkel milyen kényelmesen lehet olyan feladatokat megol dani, amelyek programja, mondjuk, PASCAL nyelven meglehetosen körülményes lenne. A beépített függvények körét ki-ki saját fejlesztésu programokkal bovítheti. Az egyre magasabb verziószámú változatok egyre több nemlineáris feladatot megoldó függvényeket is tartalmaznak, ismét csak példákat említve: numerikus integrálásra, algebrai és differenciál egyenlet(rendszer) numerikus megoldására, optimalizálási, statisztikai feladatok megoldására szolgáló függvényt stb. Az egy családba sorolható feladatok jól tagolt könyvtárakba, készletcsomagokba (tool boxokba) vannak csoportosítva, melyeket állandóan bovítenek.
763
17. Feladatok
Lehetoség van ritka mátrixok gazdaságos tárolására és az egyes beépített függvények ritka mátrixos változatának hívására (a bemeneti adatoktól függoen automatikusan azt hasz jelentosen nálja). Ezáltal a futási ido csökken. A legújabb változatok már rendkívül gazdag grakus lehetoségeket is kínálnak. a Megjelent az intervallum aritmetikai csomag is, letöltheto http:/www.ti3.tu-harburg.de\%7Erump\ intlab helyrol. Más programozási nyelven (pl. C vagy FORTRAN) megírt programok is beépíthetok, alkalmas illesztéssel. Végül meg kell az elonyei között említeni, hogy nagyon jó súgóval rendelkezik. Többszintes tájékoztatást kérhet az alkalmazó, HTML fájlokban pedig egészen részletes leírások olvashatók a matematikai háttér magyarázatokkal együtt.
Feladatok 17-1. Túlcsordulás nélkül Írjunk olyan MATLAB programot, amely az
k x k2 =
P
n i=1
2
xi
1/2
normát a részeredmények
túlcsordulása nélkül minden olyan esetben kiszámítja, amelyben a végeredmény nem okoz túlcsordulást, ugyanakkor a végeredmény hibája sem nagyobb, mint ami az eredeti formulával adódik. 17-2. Becslés
− 3.330000x2 + 3.686300x − 1.356531 = 0 egyenletnek egy megoldása x1 = 1.01. A 3 2 perturbált x − 3.3300x + 3.6863x − 1.3565 = 0 egyenlet gyökei legyenek y1 , y2 , y3 , y4 . Adjunk becslést a mini | x1 − yi | eltérésre. Az x
3
17-3. Kétszeres szóhosszúság Tekintsünk olyan kétszeres szóhosszúságú aritmetikai rendszert, amelyben minden 2t jeggyel ábrázolt szám 2 db, egyenként t jegyu szóban van tárolva. Tegyük fel, hogy a számítógép egyszerre csak t jegyu számokat tud összeadni. Tegyük fel továbbá, hogy a túlcsordulást felismeri a gép. (i) Gondoljunk ki algoritmust két ilyen kétszeres szóhosszúságú szám összeadására, feltéve, hogy azok pozitívak. (ii) Ha az ábrázolás megköveteli, hogy a számok mindkét felének legyen elojele, akkor módosítsuk az algoritmust úgy, hogy képes legyen mind a pozitív, mind a negatív számok helyes összeadására és az összeg mindkét részének azonos elojele legyen. Feltehetjük, hogy a teljes összeg nem okoz túlcsordulást. 17-4. Auchmuty-tétel Írjunk MATLAB programot az Auchmuty-féle (lásd 17.22 tétel.) hibabecslésre és végezzük vizsgálatokat. el a következo
= bi egyenletrend∈ Rn×n adott mátrix, bi = Ayi , yi ∈ Rn (i = 1, . . . , N) véletlen vektorok úgy, hogy kyi k∞ ≤ össze a tényleges ke xi − yi k, (i = 1, . . . , N) és becsült
β. Hasonlítsuk 2 T megolxi ) hibákat, ahol e xi az Ax = bi egyenletrendszer közelíto ES T i = kr( e xi )k2 / A r(e 2
(i) Oldjuk meg kis és nagy kondíciószámú mátrixok esetén is az Ax szereket, ahol A
dása. Mekkora a ci számok minimuma, maximuma, átlaga és szórása? A kapott mennyisé-
764
17. Tudományos számítások
geket grakusan is ábrázoljuk. Javasolt értékek: n
≤ 200, β = 200, N = 40.
(ii) Vizsgáljuk meg a kondíciószám és a méret hatását. (iii) Végezzük el az (i), (ii) feladatokat a LINPACK és BLAS programcsomagok segítségével. 17-5. Hilbert-mátrix
= = 1/(i +
Tekintsük az Ax
b lineáris egyenletrendszert, ahol A a negyedrendu Hilbert mátrix
vagyis ai, j
j) és b
=
[1, 1, 1, 1]
T
.
Ismert, hogy A rosszul kondicionált, ezért az
inverzét közelítsük B-vel, ahol
202 −1212 B = 2121 −1131
−1212
2121
8181
−15271
−15271
29694
8484
−16968
Tehát az x megoldás egy x0 közelítése: x0
=
−1131 8484 . −16968 9898
Bb. Ez nyilván nem a pontos eredmény, de még
csak nem is elfogadható közelítés, mert tudjuk, hogy a pontos megoldásnak is csak egész komponensei vannak. Alkalmazzuk az iteratív javítást az elfogadható egész megoldás megkeresésére, az A
−1
helyett annak B közelítését használva.
17-6. Konzisztens norma
kAk konzisztens norma és tekintsük az Ax = b egyenletrendszert. + ∆A szinguláris, akkor cond(A) ≥ kAk / k∆Ak. (ii) Mutassuk meg, hogy 2-es norma esetén (i)-ben az egyenloség áll
−bxT /(bt x) és
A−1
2 kbk2 =
A−1 b
2 . Legyen
(i) Igazoljuk, hogy ha A
fenn, ha
∆A =
(iii) Az (i)-t felhasználva adjunk alsó korlátot a cond∞ (A)-ra, ha
1 A = −1 1
−1 ε ε
ε . ε
1
17-7. Cholesky-módszer Tekintsük az Ax
= b lineáris egyenletrendszert, ahol 0 0 0 5.5 0 0 5.5 0 0 0 0 0 6.25 0 3.75 A = 0 0 0 5.5 0 0 0 3.75 0 6.25 3.5 1.5 0 0.5 0
3.5 1.5 0 0.5 0 5.5
,
b =
1 1 1 1 1 1
.
Mivel A szimmetrikus, pozitív denit, ezért a Cholesky-módszerrel oldjuk meg. Adjuk meg a pontos A
=
LL
T
felbontást és az egyenletrendszer pontos megoldását. A Cholesky közelítésre L L T = A + F. Igazolható, hogy β felbontás során a pontos L helyett kapott L
≤e , ij
alapú, t mantisszahosszúságú lebegopontos aritmetikában az F elemeire fennáll: fi j ahol
E
1−t = β
11
0
0
0
0
3.5
0
11
0
0
0
1.5
0
0
0
0
0
0
0
0
0
11
0
0.5
0
0
0
0
0
0
3.5
1.5
0
0.5
0
11
.
765
17. Megjegyzések a fejezethez
IBM3033 típusú számítógépnél
β =
16 és t
=
14. Adjunk korlátot a kapott x közelíto
megoldás relatív hibájára. 17-8. BauerFike-tétel Legyen
A =
10
10 9
10 8
10
..
.
..
.
2
10
ε
1
.
ε = 10−5 , 10−6 , 10−7 , 0 esetén. (ii) Vizsgáljuk meg a BauerFike tétel becslését az A = A(0) mátrixhoz képest. (i) Vizsgáljuk meg a sajátértékek megváltozását az 17-9. Sajátérték Határozzuk meg B
=
T
AA
n értékekre a sajátértékeit véletlen A mátrixokkal különbözo
MATLAB eig rutinjával, ahol A
∈
R
n×n
adott mátrix. hHatározzuk imeg a B
sajátértékeit, ha Ri véletlen mátrix, amelynek elemei a (i
= 1, . . . , N). Mekkora B és a B + Ri
−10−5 , 10−5
+
Ri mátrix
intervallumba esnek
sajátértékeinek maximális eltérése? Milyen pontos a
Bauer-Fike-tétel becslése? Javasolt értékek: N
= 10, 5 ≤ n ≤ 200.
Hogyan alakulnak az eredmények a kondíciószám függvényében? Tapasztalunk-e függést az n rendszámtól? Ábrázoljuk grakusan a maximális eltéréseket és a BauerFike-tétel becslését.
Megjegyzések a fejezethez megoldására alkalmazott utólagos hibabecslések A lineáris egyenletrendszerek közelíto nem teljesen megbízhatók. Demmel, Diament és Malajovich
kimutatták, hogy az
Θ
2
n
esetén mindig vannak olyan esetek, amikor a becslés megköltségu kondíciószámbecslok bízhatatlan (a becslés hibája meghalad egy meghatározott nagyságrendet) [107]. megoldására vonatkozó iteratív javítás elso isA lineáris egyenletrendszerek közelíto mert alkalmazása Fox, Goodwin, Turing és Wilkinson nevéhez fuz odik (1946). A tapasztalatok szerint a reziduális hiba csökkenése nem monoton. A módszer alkalmazásának egy lehetséges változata a pointeres LU-módszerrel összekapcsolva a [441] könyvben is szerepel. összefoglalását tartalAz iterációs módszerek elméletének és alkalmazásainak kitun o átmazzák Young , illetve Hageman és Young könyvei [503], [188]. A téma szoftverelvu tekintését adják Barett, Berry és társaik [31]. Itt hívjuk fel a gyelmet Andreas Frommer könyvére is, amely az iteratív módszerek párhuzamosítására is kitér [141]. A QR-módszer konvergenciájára vonatkozó 17.34. tételnél lényegesen jobb konvergencia eredmények is ismertek. Számos, a QR-módszerrel rokon eljárás ismert a sajátérték feladat megoldására (lásd például [492], [488]). Ezek közül az egyik legismertebb, az ún. LR módszer, amit pozitív denit hermitikus mátrixra elonyös alkalmazni. Lényege: állítsuk az Ak elo
=
∗
LL Cholesky-felbontást, majd legyen Ak+1
=
∗
L L.
Ismeretesek implicit, dupla eltolást alkalmazó, a QR-módszerhez hasonló eljárások is. Mindenesetre már a 3 × 3-as Hessenberg-alakú mátrixok között is van példa, hogy komplex
766
17. Tudományos számítások
el konvergencia azaz a (17.41)-ben sajátértékek esetén többszörös eltolással sem érheto megmutatott alak pontos számítások mellett, amint azt Batterson kimutatta [34]:
0.83116322648071935 0.35613892213531548 0
−0.34924697025783983 0.86568478391818912 −0.35613892213531548
0.06972435460743861 0.34924697025783983 0.83116322648071935
.
(a kerekítési hibák miatt, paradox módon, mégis tapasztalható igen lassú konvergencia).
17. Megjegyzések a fejezethez
767
768
17. Tudományos számítások
Irodalomjegyzék
[1] S. Abiteboul, V. Vianu. Foundations of Databases. Addison-Wesley, 1995. 534, 535 [2] L. Addario-Berry, B. Chor, M. Hallett, J. Lagergren, A. Panconesi, T. Wareham. Ancestral maximum likelihood of phylogenetic trees is hard. Lecture Notes in Bioinformatics, 2812:202215, 2003. 577 [3] R. G. Addie, M. Zukerman, T. Neame. Broadband traffic modeling: Simple solutions to hard problems. IEEE Communications Magazine, (8):8895, 1998. 221 [4] M. Agrawal, N. Kayal, N. M. Saxena. PRIMES is in P. Available at http://www.cse.iitk.ac.in/users/ manindra/primality.ps, 2002. 123 [5] A. Aho, C. Beeri, J. D. Ullman. The theory of joins in relational databases. ACM Transactions on Database Systems, 4(3):297314, 1979. 534 [6] A. V. Aho, J. E. Hopcroft, J. D. Ullman. The Design and Analysis of Computer Algorithms. Addison-Wesley, 1974. Magyarul: Számítógép-algoritmusok tervezése és analízise. Muszaki Könyvkiadó, 1982. 9 [7] R. K. Ahuja, T. L. Magnanti, J. B. Orlin. Network Flows: Theory, Algorithms, and Applications. Prentice Hall, 1993. 604 [8] A. G. Akritas. Elements of Computer Algebra with Applications. John Wiley & Sons, 1989. 93 [9] T. Akutsu. Dynamic programming algorithms for RNA secondary prediction with pseudoknots. Discrete Applied Mathematics, 104:4562, 2000. 578 [10] E. Althaus, A. Caprara, H. Lenhof, K. Reinert. Multiple sequence alignment with arbitrary gap costs: Computing an optimal solution using polyhedral combinatorics. Bioinformatics, 18:S4S16, 2002. 576 kiadása, 1998. 604 [11] I. Althöfer. 13 Jahre 3-Hirn. A szerzo [12] I. Althöfer. List-3-Hirn vs. grandmaster Yussupov report on a very experimental match. ICCA Journal, 21:5260 and 131134, 1998. 604 [13] I. Althöfer. Improved game play by multiple computer hints. Theoretical Computer Science, 313:315324, 2004. 604 [14] I.
Althöfer,
F.
Berger,
S.
Schwarz.
Generating
True
Alternatives
with
a
http://www.minet.uni-jena.de/Math-Net/reports/shadows/02-04report.html, 2002. 604
Penalty
Method.
[15] I. Althöfer, J. de Koning, J. Lieberum, S. Meyer-Kahlen, T. Rolle, J. Sameith. Five visualisations of the k-best mode. ICCA Journal, 26:182189, 2003. 604 [16] G. M. Amdahl. Validity of the single-processor approach to achieving large-scale computer capabilities. In AFIPS Conference Proceedings, 30. kötet, 483485. o., 1967. 267 [17] D. Anick, D. Mitra, M. Sondhi. Stochastic theory of a data handling system with multiple sources. Bell System Technical Journal, 61:18711894, 1982. 221 [18] V. Arlazanovan. A. Dinic, M. Kronrod, I. Faradzev. On economic construction of the transitive closure of a directed graph. Doklady Academii Nauk SSSR, 194:487488, 1970. 576 [19] W. Armstrong. Dependency structures of database relationships. In Proceedings of IFIP Congress, 580 583. o. North Holland, 1974. 534 [20] V. Arvind, P. Kurur. Graph isomorphism is in SPP. In Proceedings of the 43rd IEEE Symposium on Foundations of Computer Science, 743750. o. IEEE Computer Society Press, 2002. 159 [21] K. Atteson. The performance of the neighbor-joining method of phylogeny reconstruction. Algorithmica, 25(2/3):251278, 1999. 578 [22] J-P. Aubin. Mathematical Methods of Game and Economic Theory. North-Holland, 1979. 360
770
Irodalomjegyzék
[23] L. Babai. Trading group theory for randomness. In Proceedings of the 17th ACM Symposium on Theory of Computing, 421429. o. ACM Press, 1985. 123, 124 [24] L. Babai, S. Moran. Arthur-Merlin games: A randomized proof system, and a hierarchy of complexity classes. Journal of Computer and Systems Sciences, 36(2):254276, 1988. 123, 124 [25] I. Bach. Formális nyelvek (Formal languages). Typotex, 2001. 576 [26] B. Baker. A tight asymptotic bound for next-t decreasing bin-packing. SIAM Journal on Algebraic and Discrete Methods, 2(2):147152, 1981. 502 [27] E. Balas. Sequencing via disjunctive graphs: an implicit enumeration algorithm. Operation Research, 17:941953, 1969. 414 [28] B. Balkenhol, S. Kurtz. Universal data compression based on the BurrowsWheeler transform: theory and practice. IEEE Transactions on Compututers, 49(10):10431053953, 2000. 454 [29] J. Banks, J. Carson, B. Nelson. Discrete-Event Simulation. Prentice Hall, 1996. 221 [30] W. Banzhaf. Interactive evolution. In T. Back, D. B. Fogel, Z. Michalewicz, T. Baeck (szerkesztok), Handbook of Evolutionary Computation. IOP Press, 1997. 604 [31] R. Barett, M. Berry, T. F. Chan, J. Demmel, J. Donato, J. Dongarra, V. Eijkhout, R. Pozzo, C. Romine, H. van der Vorst. Templates for the Solution of Linear Systems: Building Blocks for Iterative Methods. SIAM, 1994. 765 [32] J. R. Barker, G. B. McMahon. Scheduling the general job-shop. Management Science, 31:594598, 1985. 414, 415 [33] T. Bartha, A. Pataricza. Formális módszerek az informatikában (Formal Methods in Informatics). Typotex, 2004. 455 [34] S. Batterson. Convergence of the shifted QR algorithm on 3
× 3 normal matrices.
, 58, 1990. 766
[35] C. Beeri. On the membership problem for functional and multivalued dependencies in relational databases. ACM Transactions on Database Systems, 5:241259, 1980. 534 [36] C. Beeri, P. Bernstein. Computational problems related to the design of normal form relational schemas. ACM Transactions on Database Systems, 4(1):3059, 1979. 534 [37] C. Beeri, M. Dowd. On the structure of armstrong relations for functional dependencies. Journal of ACM, 31(1):3046, 1984. 534 [38] C. Beeri, R. Fagin, J. Howard. A complete axiomatization for functional and multivalued dependencies. In ACM SIGMOD Symposium on the Management of Data, 4761. o., 1977. 534 [39] T. C. Bell, I. H. Witten, J. G. Cleary. Modeling for text compression. Communications of the ACM, 21:557 591, 1989. 454 [40] T. C. Bell, I. H. Witten, J. G. Cleary. Text Compression. Prentice Hall, 1990. 454, 455 [41] A. Benczúr A. Kiss, T. Márkus. A relációs adatmodell függoségeinek egy általános osztálya és implikációs problémáinak vizsgálata. Alkalmazott Matematikai Lapok, 13:291312, 1987-88. 535 [42] J. Beran. Statistics for Long-Memory Processes. Monographs on Statistics and Applied Probability. Chapman & Hall, 1986. 221 [43] J. Beran, R. Sherman, M. Taqqu, W. Willinger. Long-range dependence in variable-bit-rate video traffic. IEEE Transactions on Communications, 43:15661579, 1995. 221 [44] F. Berger. k alternatives instead of k shortest paths. Master's thesis, Friedrich Schiller Egyetem, Jéna, Matematikai és Informatikai Kar, 2000. Diplomamunka. 604 [45] K. A. Berman, J. L. Paul. Sequential and Parallel Algorithms. PWS Publishing Company, 1996. 266 [46] A. Beygelzimer, L. Hemaspaandra, C. Homan, J. Rothe. One-way functions in worst-case cryptography: Algebraic and security properties are on the house. SIGACT News, 30(4):2540, 1999. 123 [47] A. Békéssy, J. Demetrovics. Contribution to the theory of data base relations. Discrete Mathematics, 27(1):110, 1979. 534 [48] A. Békéssy, J. Demetrovics. Eloadások adatbázis szerkezetekrol (Lectures on data base structures). ELTE Eötvös Kiadó, 1999. 535 [49] A. Békéssy, J. Demetrovics. Adatbázis szerkezetek (Data Base structures). Akadémiai Kiadó, 2004. Nyomdában. 535 [50] J. Blazewicz, K. Ecker, E. Pesch, G. Schmidt, J. Weglarz. Scheduling Computer and Manufacturing Processes. Springer-Verlag, 2001 (2. kiadás). 415 [51] L. A. Bélády. A study of replacement algorithms for a virtual storage computer. IBM Systems Journal, 5(2):78101, 1965. 502
771
Irodalomjegyzék
[52] L. A. Bélády, R. Nelson, G. S. Shedler. An anomaly in space-time characteristics of certain programs running in paging machine. Communications of the ACM, 12(1):349353, 1969. 502 [53] J. Blinn. A generalization of algebraic surface drawing. ACM Transactions on Graphics, 1(3):135256, 1982. 683, 684 [54] J. Bloomenthal. Introduction to Implicit Surfaces. Morgan Kaufmann Publishers, 1997. 683 [55] D. Boneh. Twenty years of attacks on the RSA cryptosystem. Notices of the AMS, 46(2):203213, 1999. 123 [56] B. Borchert, L. Hemaspaandra, J. Rothe. Restrictive acceptance suffices for equivalence problems. London Mathematical Society Journal of Computation and Mathematics, 86:8695, 2000. 159 [57] R. P. Brent. The parallel evaluation of general arithmetic expressions. Journal of the ACM, 21:201206, 1974. 267 [58] J. E. Bresenham. Algorithm for computer control of a digital plotter. IBM Systems Journal, 4(1):2530, 1965. 684 [59] G. Brooks, C. R. White. An algorithm for nding optimal or near optimal solutions to the production scheduling problem. Journal of Industrial Engineering, 16:3440, 1965. 414 [60] L. E. J. Brouwer. Über Abbildung von Manningfaltigkeiten. Mathematische Annalen, 97115. o., 1912. 359 [61] P. Bruckner. Scheduling Algorithms. Springer-Verlag, 1998. 413 [62] B. Buchberger. Ein algorithmus zum auffinden der basiselemente des restklassenringes nach einem nulldimensionalen polynomideal, 1965. PhD disszertáció, Leopold-Franzens-Universität, Innsbruck. 92 [63] M. Burrows, D. J. Wheeler. A block-sorting lossless data compression algorithm. Research Report 124, http://gatekeeper.dec.com/pub/DEC/SRC/research-reports/abstracts/src-rr-124.html, 1994. 454
[64] L. Buttyán, I. Vajda. Kriptográa és alkalmazásai (Cryptography and its Applications). Typotex, 2004. 124 [65] CACI. COMNET III. CACI Products Co., 1997. 221 [66] Calgary. The Calgary/Canterbury Text Compression. ftp://ftp.cpsc.ucalgary.ca/pub/projects/text.compression. corpus, 2004. 455 [67] Canterbury. The Canterbury Corpus. http://corpus.canterbury.ac.nz, 2004. 455 [68] J. Carlier, E. Pinson. Algorithm for solving the job-shop problem. Management Science, 35:164176, 1989. 414, 415 [69] J. L. Carter, M. N. Wegman. Universal classes of hash functions. Journal of Computer and System Sciences, 18(2):143154, 1979. 159 [70] E. Catmull, J. Clark. Recursively generated B-spline surfaces on arbitrary topological meshes. ComputerAided Design, 10:350355, 1978. 683 [71] B. F. Caviness. Computer algebra: past and future. Journal of Symbolic Computations, 2:217263, 1986. 93 [72] R. Chandra, L. Dagum, D. Kohr, D. Maydan, J. McDonald, R. Menon. Parallel Programming in OpenMP. Morgan Kaufmann Publishers, 2000. 267 [73] J. Charlton, C.
C. Death. A method of solution for general machine scheduling problems. Operations
Research, 18:689707, 1970. 414 [74] B. Chazelle. Triangulating a simple polygon in linear time. Discrete and Computational Geometry, 6(5):353363, 1991. 683 [75] S. M. Christensen. Resources for computer algebra. Computers in Physics, 8:308315, 1994. 93 [76] D. Christie. Sorting permutations by block-interchanges. Information Processing Letters, 60(4):165169, 1996. 578 [77] E. F. Codd. Further normalization of the data base relational model. In R. Rustin (szerkeszto), Courant Computer Science Symposium 6: Data Base Systems, 3364. o. Prentice Hall, 1972. 534 Courant Compu[78] E. F. Codd. Relational completeness of database sublanguages. In R. Rustin (szerkeszto), ter Science Symposium 6: Data Base Systems, 6598. o. Prentice Hall, 1972. 534 [79] E. F. Codd. Recent investigations in relational data base systems. In Information Processing 74, 10171021. o. North-Holland, 1974. 534 [80] E. F. Codd. A relational model of large shared data banks. Communications of the ACM, 13(6):377387, 1970. 534
772
Irodalomjegyzék
[81] E. F. Codd. Normalized database structure: A brief tutorial. In ACM SIGFIDET Workshop on Data Description, Access and Control, 2430. o., 1971. 534 [82] E. Coffman. Computer and Job Shop Scheduling. John Wiley & Sons, 1976. 415, 502 [83] E. Coffman, M. Garey, D. Johnson. An application of bin-packing to multiprocessor scheduling. SIAM Journal on Computing, 7:117, 1978. 414 [84] E. G. Coffman, J. Csirik, G. J. Woeginger. Approximate solutions to bin packing problems. In P. M. Pardalos, M. G. C. Resende (szerkesztok), Handbook of Applied Optimization, 607615. o. Oxford University Press, 2002. 414 [85] A. M. Cohen, L. van Gasten, S. Lunel (szerkesztok). Computer Algebra for Industry 2, Problem Solving in Practice. John Wiley & Sons, 1995. 93 [86] A. M. Cohen (szerkeszto). Computer Algebra for Industry: Problem Solving in Practice. John Wiley & Sons, 1993. 93 [87] S. Cook. The complexity of theorem proving procedures. In Proceedings of the Third Annual ACM Symposium on Theory of Computing, 151158. o. ACM Press, 1971. 158 [88] D. Coppersmith. Small solutions to polynomial equations, and low exponent RSA vulnerabilities. Journal of Cryptology, 10(4):233260, 1997. 123 [89] T. H. Cormen, C. E. Leiserson, R. L. Rivest. Introduction to Algorithms. The MIT Press/McGraw-Hill, Kiadó, 2003, negyedik kiadás). 9, 266 1990 (Magyarul: Algoritmusok. Muszaki [90] T. H. Cormen, C. E. Leiserson, R. L. Rivest, C. Stein. Introduction to Algorithms. The MIT Press/McGrawHill, 2003 (Második kiadás negyedik, javított utánnyomása. Magyarul: Új algoritmusok. Scolar Kiadó, 2003). 9, 92, 93, 159, 263, 454, 502, 576, 716 [91] T. M. Cover, J. A. Thomas. Elements of Information Theory. John Wiley & Sons, 1991. 455 [92] H. S. M. Coxeter. Projective Geometry. University of Toronto Press, 1974 (2. kiadás). 683 [93] R. Cristescu, G. Marinescu. Unele aplicatii ale teoriei distributilor. Editura academiei republicii socialiste, Magyarul: Bevezetés a disztribúcióelméletbe és alkalmazásaiba, Muszaki könyvkiadó, 1969). 716 [94] M. Crovella, A. Bestavros. Self-similarity in world wide web traffic: Evidence and possible causes. IEEE/ACM Transactions on Networking, 5(6):835846, 1997. 221
[95] I. Csiszár, J. Körner. Coding Theorems for Discrete Memoryless Systems. Akadémiai Kiadó, 1981 (Magyarul: Információelmélet. Tankönyvkiadó, 1980). 455 [96] D. E. Culler, R. M. Karp, D. Patterson, A. Sahay, E. E. Santos, K. E. Schauser, R. Subramonian, T. von Eicken. Logp: A practical model of parallel computation. Communication of the ACM, 39(11):7885, 1996. 267 [97] D. E. Culler, J. P. Singh, A. Gupta. Parallel Computer Architecture: A Hardware/Software Approach. Morgan Kaufman Publisher, 1983. 267 [98] E. Dantsin, A. Goerdt, R. Kannan, J. Kleinberg, C. Papadimitriou, P. Raghavan, U. Schöning. A deterministic (2 − 2/(k
+ 1))n
algorithm for k-sat based on local search. Theoretical Computer Science, 289(1):6983,
2002. 158, 159 [99] A. Darte, Y. Robert, F. Vivien. Scheduling and Automatic Parallelization. Birkhäuser Boston, 2000. 310 [100] J. Davenport, Y. Siret, E. Tournier, E.. Computer Algebra: Systems and Algorithms for Algebraic Computation. Academic Press, 2000. 93 [101] M. de Berg. Efficient Algorithms for Ray Shooting and Hidden Surface Removal. PhD thesis, Rijksuniversiteit te Utrecht, 1992. 683 [102] M. de Berg, M. van Kreveld, M. Overmars, O. Schwarzkopf. Computational Geometry: Algorithms and Applications. Springer-Verlag, 2000. 683 [103] C. Delobel. Normalization and hierarchical dependencies in the relational data model. ACM Transactions on Database Systems, 3(3):201222, 1978. 534 [104] J. Demetrovics, Gy. O. H. Katona, A. Sali. Minimal representations of branching dependencies. Discrete Applied Mathematics, 40:139153, 1992. 535 [105] J. Demetrovics, Gy. O. H. Katona, A. Sali. Minimal representations of branching dependencies. Acta Scientiarum Mathematicorum (Szeged), 60:213223, 1995. 535 [106] J. Demetrovics, Gy. O. H. Katona, A. Sali. Design type problems motivated by database theory. Journal of Statistical Planning and Inference, 72:149164, 1998. 535 [107] J. Demmel, D. Malajovich. On the complexity of computing error bounds. Foundations of Computational Mathematics, 1:101125, 2001. 765
Irodalomjegyzék
773
[108] P. Denning. Virtual memory. Computing Surveys, 2(3):153189, 1970. 501 Gy. Szabó. Bevezetés a térinformatikába (Introduction to Geoinformatics). Nemzeti Tan[109] A. Detrekoi, könyvkiadó, 1995. 716 Gy. Szabó. Térinformatika (Geoinformatics). Nemzeti Tankönyvkiadó, 2003 (második kia[110] Á. Detrekoi, dás). 716 [111] W. Diffie, M. E. Hellman. New directions in cryptography. IEEE Transactions on Information Theory Theory, IT-22(6):644654, 1976. 122 [112] D. Doernberg. Interview with Donald Knuth. Computer Literacy, 1993. 579 [113] N. Duffield, N. Oconnell. Large deviation and overow probabilities for the general single-server queue, with applications. Mathematical Proceedings of the Cambridge Philosophical Society, 118:363374, 1995. 221 [114] D. Duffy, A. McIntosh, M. Rosenstein, W. Willinger. Statistical analysis of ccsn/ss7 traffic data from working ccs subnetworks. IEEE Journal on Selected Areas Communications, 12:544551, 1994. 221 [115] J. Duncan. The Elements of Complex Analysis. John Wiley & Sons, 1968 (Magyarul: Bevezetés a komplex függvénytanba, Muszaki Könyvkiadó, 1974). 716 [116] R. Durbin, S. Eddy, A. Krogh, G. Mitchison. Biological Sequence Analysis. University Press, 1998. 576 [117] N. Dyn, J. Gregory, D. Levin. A buttery subdivision scheme for surface interpolation with tension control. ACM Transactions on Graphics, 9:160169, 1990. 683 [118] M. Effros, K. Viswesvariah, S. Kulkarni, S. Verdú. Universal lossless source coding with the burrows wheeler transform. IEEE Transactions on Information Theory Theory, 48(5):10611081, 2002. 454 [119] S. N. Elaydi. An Introduction to Difference Equations. Springer-Verlag, 1999 (2. kiadás). 37 M. Steel, L. Székely, T. Warnow. Local quartet splits of a binary tree infer all quartet splits via one [120] P. Erdos, dyadic inference rule. Computers and Articial Intelligence, 16(2):217227, 1997. 578 [121] A. Erramilli, O. Narayan, W. Willinger. Experimental queueing analysis with long-range dependent packettraffic. IEEE/ACM Transactions on Networking, 4(2):209223, 1996. 221
[122] R. Fagin. Multivalued dependencies and a new normal form for relational databases. ACM Transactions on Database Systems, 2:262278, 1977. 534 [123] R. Fagin. Armstrong databases. In Proceedings of IBM Symposium on Mathematical Foundations of Computer Science, 1982. 534 [124] R. Fagin. Horn clauses and database dependencies. Journal of ACM, 29(4):952985, 1982. 534 [125] G. Farin. Curves and Surfaces for Computer Aided Geometric Design. Morgan Kaufmann Publishers, 1998. 683 [126] J. Felsenstein. Inferring Phylogenies. Sinauer Associates, Inc., 2003. 576 [127] S. Fenner, L. Fortnow, S. Kurtz. Gap-denable counting classes. Journal of Computer and System Sciences, 48(1):116148, 1994. 159 [128] R. Fernando. GPUGems: Programming Techniques, Tips, and Tricks for Real-Time Graphics. AddisonWesley, 2004. 684 [129] M. L. Fisher. Optimal solution of scheduling problems using lagrange multipliers: Part I. Operations Research, 21:11141127, 1973. 414, 415 [130] M. L. Fisher. Optimal solution of scheduling problems using lagrange multipliers: Part II,. In S. E. Elmagh Symposium on the Theory of Scheduling and Its Applications. Springer-Verlag, 1973. 414 raby (szerkeszto), [131] Z. Fülöp. Formális nyelvek és szintaktikus elemzésük (Formal Languages and their Syntactical Analysis). Polygon, 2000. 576 [132] M. J. Flynn. Very high-speed computer systems. Proceedings of the IEEE, 5(6):19011909, 1966. 266 [133] J. D. Fooley, A., S. K. Feiner, J. F. Hughes. Computer Graphics: Principles and Practice. Addison-Wesley, 1990. 684 [134] F. Forgó, J. Szép, F. Szidarovszky. Introduction to the Theory of Games: Concepts, Methods and Applications. Kluwer Academic Publishers, 1999. 360 és Winkler Zoltán (szerkeszto), 5th [135] P. Fornai, A. Iványi. Bélády's anomaly is unbounded. In Kovács Elod International Conference on Applied Informatics, 6572. o. Molnár és társa, 2002. 502 [136] S. Fortune, J. Wyllie. Parallelism in random access machines. In Proceedings of the Tenth Annual ACM Symposium on Theory of Computing, 114118. o., 1978. 267
774
Irodalomjegyzék
[137] I. Foster, C. Kesselman. The Grid: Blueprint for a New Computing Infrastructure. Morgan Kaufman Publisher, 2004 (2. kiadás). 267 [138] I. Foster, C. Kesselman, J. M. Nick, S. Tuecke. The physiology of the grid: An open grid services architecture for distributed systems integration. Available at www.globus.org/research/papers/ogsa.pdf, 2002. 267 [139] D. K. Friesen. Tighter bounds for the multit processor scheduling algorithm. Journal of Algorithms, 7:35 59, 1984. 414 [140] D. K. Friesen, M. A. Langston. Evaluation of a multit-based scheduling algorithm. Journal of Algorithms, 7:3559, 1986. 414 [141] A. Frommer. Lösung linearer Gleichungssysteme auf Parallelrechnern. Vieweg Verlag, 1990. 765 [142] H. Fuchs, Z. M. Kedem, B. F. Naylor. On visible surface generation by a priory tree structures. In Computer Graphics (SIGGRAPH '80 Proceedings), 124133. o., 1980. 684 [143] A. Fujimoto, T. Takayuki, I. Kansey. ARTS: accelerated ray-tracing system. IEEE Computer Graphics and Applications, 6(4):1626, 1986. 683 [144] S. Gajdos. Adatbázisok (Data Bases). Muegyetemi Kiadó, 2001. 535 [145] T. Gal, T. Stewart, T. Hanne (szerkesztok). Multicriteria Decision Making. Kluwer Academic Publisher, 1999. 604 [146] G. Galambos. Operációs rendszerek (Operating Systems). Muszaki Könyvkiadó, 2003. 502 [147] H. Garcia-Molina, J. D. Ullman. Database System Implementation. Prentice Hall, 2000. Magyarul: Adatbázisrendszerek megvalósítása. Panem, 2001. 535 [148] M. R. Garey, R. L. Graham. Performance guarantees for scheduling algorithm. Operations Research, 26:3 21, 1978. 415 [149] M. R. Garey, D. S. Johnson. Computers and Intractability: A Guide to the Theory of NP-Completeness. W. H. Freeman, 1979. 10, 158 [150] W. H. Gates, C. Papadimitriou. Bounds for sorting by prex reversals. Discrete Mathematics, 27:4757, 1979. 578 [151] F. Gécseg, I. Peák. Algebraic Theory of Automata. Akadémiai Kiadó, 1972. 501 [152] K. O. Geddes S. Czapor, G. Labahhn. Algorithms for Computer Algebra. Kluwer Academic Publishers, 1992. 92, 93 [153] P. B. Gibbons, Y. Matias, V. Ramachandran. Can a shared-memory model serve as a bridging model for parallel computation. Theory of Computing Systems, 32(3):327359, 1999. 267 [154] A. Glassner. An Introduction to Ray Tracing. Academic Press, 1989. 683 [155] A. Gál, S. Halevi, R. Lipton, E. Petrank. Computing from partial solutions. In Proceeding of the 14th Annual IEEE Conference on Computational Complexity, 3445. o. IEEE Computer Society Press, 1999. 159 [156] D. E. Goldberg. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley, 1989. 604 [157] N. Goldman, J. Thorne, D. Jones. Using evolutionary trees in protein secondary structure prediction and other comparative sequence analyses. Journal of Molecular Biology, 263(2):196208, 1996. 577 [158] O. Goldreich. Randomness, interactive proofs, and zero-knowledge a survey. In R. Herken (szerkeszto), The Universal Turing Machine: A Half-Century Survey, 377405. o. Oxford University Press, 1988. 124 [159] O. Goldreich. Foundations of Cryptography. Cambridge University Press, 2001. 123, 124 [160] O. Goldreich, S. Micali, A. Wigderson. Proofs that yield nothing but their validity or all languages in NP have zero-knowledge proof systems. Journal of the ACM, 38(3):691729, 1991. 123 [161] S. Goldwasser. Interactive proof systems. In J. Hartmanis (szerkeszto), Computational Complexity Theory, AMS Short Course Lecture Notes: Introductory Survey Lectures. Proceedings of Symposia in Applied Mathematics 38. kötete, 108128. o. American Mathematical Society, 1989. 124 [162] S. Goldwasser, S. Micali, C. Rackoff. The knowledge complexity of interactive proof systems. SIAM Journal on Computing, 18(1):186208, 1989. 123, 124 [163] S. Goldwasser, M. Sipser. Private coins versus public coins in interactive proof systems. In S. Micali (szer Randomness and Computation, Advances in Computing Research 5. kötete, 7390. o. JAI Press, keszto), 1989. A preliminary version appeared in Proc. 18th Ann. ACM Symp. on Theory of Computing, 1986, pp. 5968. 123 [164] G. Gonnet, D. Gruntz, L. Bernardin Computer algebra systems.
In A. Ralston, E. D. Reilly, D.
Hemmendinger (szerkesztok), Encyclopedia of Computer Science, 287301. o. Nature Publishing Group, 4. kiadás, 2000. 93
775
Irodalomjegyzék
[165] O. Gotoh. An improved algorithm for matching biological sequences. Journal of Molecular Biology, 162:705708, 1982. 575 [166] H. Gouraud. Computer display of curved surfaces. IEEE Transactions on Computers, C-20(6):623629, 1971. 678 [167] J. Grabowski. On two-machine scheduling with release and due-dates to minimize maximum lateness. Opsearch, 17:133154, 1980. 414 [168] R. L. Graham. Bounds for certain multiprocessor anomalies. Bell Systems Technical Journal, 45:1563 1581, 1966. 414 [169] R. L. Graham. Bounds on multiprocessing timing anomalies. SIAM Journal on Applied Mathematics, 17:416429, 1969. 415 [170] R. L. Graham, E. L. Lawler, J. K. Lenstra, A. H. G. Rinnoy Kan. Optimization and approximation in deterministic sequencing and scheduling: a survey. Annals of Discrete Mathematics, 5:287326, 1979. 413 [171] R. L. Graham, D. E. Knuth, O. Patashnik. Concrete Mathematics. Addison-Wesley, 1994 (2. kiadás. Magyarul: Konkrét matematika, Muszaki Könyvkiadó, 1998). 37, 93 [172] A. Grama, A. Gupta, G. Karypis, V. Kumar. Introduction to Parallel Computing. Addison-Wesley, 2003 (2. kiadás). 266 [173] J. Grant, J. Minker. Inferences for numerical dependencies. Theoretical Computer Science, 41:271287, 1985. 535 [174] J. Grant, J. Minker. Normalization and axiomatization for numerical dependencies. Information and Control, 65:117, 1985. 535 [175] D. H. Greene, D. E. Knuth. Mathematics for the Analysis of Algorithms. Birkhäuser, 3. kiadás, 1990. 37 [176] W. Gropp, M. Snir, B. Nitzberg, E. Lusk. MPI: The Complete Reference. Scientic and Engineering Computation Series. The MIT Press, 1998. 267 [177] A. Große, J. Rothe, G. Wechsung. Computing complete graph isomorphisms and hamiltonian cycles from partial ones. Theory of Computing Systems, 35(1):8193, 2002. 159 [178] A. Grosse, S. Schwarz. Bigblackcell. http://www.minet.uni-jena.de/∼BigBlackCell/. 604 [179] R. Grossman. Symbolic Computation: Applications to Scientic Computing, Frontiers in Applied Mathematics 5. kötete. SIAM, 1989. 93 [180] J. N. D. Gupta, S. S. Reddi. Improved dominance conditions for the three-machine owshop scheduling problem. Operations Research, 26:200203, 1978. 414 [181] R. Gusella. A measurement study of diskless workstation traffic on an ethernet. IEEE Transactions on Communications, 38:15571568, 1990. 221 [182] D. M. Guseld. Algorithms on Strings, Trees and Sequences. Cambridge University Press, 1997. 575, 576 [183] J. Gustafson. Reevaluating Amdahl's law. Communications of ACM, 28(1):532535, 1988. 267 [184] T. Gyires. Simulation of the harmful consequences of self-similar network traffic. The Journal of Computer Information Systems, 42(4):94111, 2002. 221 [185] L. Györ. Információ- és kódelmélet (Theory of Information and Coding). Typotex, 2002 (2. kiadás). 455 [186] J. Håstad. Solving simultaneous modular equations of low degree. SIAM Journal on Computing, 17(2):336 341, 1988. Special issue on cryptography. 123 [187] G. Hadley. Nonlinear and Dynamic Programming. Addison-Wesley, 1964. 360 [188] L. Hageman, D. Young. Applied Iterative Methods. Academic Press, 1981. 765 [189] Gy. F. Hajós. Bevezetés a geometriába (Introduction to Geometry). Tankönyvkiadó, 1972. 683 [190] T. S. Han, K. Kobayashi. Mathematics of Information and Coding. American Mathematical Society, 2002. 455 [191] D. Hankerson, G. A. Harris, P. D. Johnson. Introduction to Information Theory and Data Compression. CRC Press, 2003 (2. kiadás). 455 [192] S. Hannenhalli.
Polynomial-time algorithm for computing translocation distance between genomes.
Discrete Applied Mathematics, 71:137151, 1996. 578 [193] D. Harper, C. Wooff D. Hodginson. A Guide to Computer Algebra Systems. John Wiley & Sons, 1991. 93 [194] J. Hartmanis, L. Hemachandra. Complexity classes without machines: On complete languages for UP. Theoretical Computer Science, 58(13):129142, 1988. 159 [195] B. Cs. Hatvany. Bitképek feldolgozása Visual Basic programokból (Bitmap Processing by Visual Basic programms). Computer Books, 2003. 716
776
Irodalomjegyzék
[196] V. Havran. Heuristic Ray Shooting Algorithms. PhD thesis, Czech Technical University, 2001. 683, 684 [197] M. Höchsman, T. Töller, R. Giegerich, S. Kurtz. Local similarity in RNA secondary structure. In Proceedings of IEEE Bioinformatics Conference 2003, 159168. o., 2003. 578 [198] A. C. Hearn. Future Directions for Research in Symbolic Computation. SIAM Reports on Issues in the Mathematical Sciences. SIAM, 1990. 93 [199] H. Hees, D. Lucantoni. A markov modulated characterization of packetized voice and data traffic and related statistical multiplexer performance. IEEE Journal on Selected Areas in Communication, 4:856868, 1986. 221 [200] E. A. Heinz. Algorithmic Enhancements and Experiments at High Search Depths. Vieweg Verlag, Series on Computational Intelligence, 2000. 604 [201] L. Hemaspaaandra, K. Pasanen, J. Rothe. If P
,
NP then some strongly noninvertible functions are in-
vertible. In Proceedings of the 13th International Symposium on Fundamentals of Computation Theory, Lecture Notes in Computer Science 2138. kötete, 162171. o. Springer-Verlag, 2001. 123 [202] L. Hemaspaandra, J. Rothe. Creating strong, total, commutative, associative one-way functions from any one-way function in complexity theory. Journal of Computer and Systems Sciences, 58(3):648659, 1999. 123 [203] L. A. Hemaspaandra, M. Ogihara. The Complexity Theory Companion. EATCS Texts in Theoretical Computer Science. Springer-Verlag, 2002. 158 [204] I. Herman. The Use of Projective Geometry in Computer Graphics. Springer-Verlag, 1991. 683 [205] P. Hermann, A. Iványi. A munkahatékonyság korlátai prexszámításnál és összefésülésnél. Alkalmazott Matematikai Lapok, 2004. Submitted. 267 [206] F. Heylighen. Principia Cybernetica Project. http://pespmc1.vub.ac.be/HEYL.html, 2004. 221 [207] D. S. Hirschberg. A linear space algorithm for computing maximal common subsequences. Communications of the ACM, 18:341343, 1975. 576 Group-Theoretic Algorithms and Graph Isomorphism, Lecture Notes in Computer [208] C. Hoffman (szerkeszto). Science 136. kötete. Springer-Verlag, 1982. 159 [209] J. E. Hopcroft, R. Motwani, J. D. Ullman. Introduction to Automata Theory, Languages, and Computation. Addison-Wesley, 2. kiadás, 2001. 501 [210] W. A. Horn. Minimizing average ow time with parallel machines. Operations Research, 21:845847, 1973. 414 [211] E. Horowitz, S. Sahni, S. Rajasekaran. Computer Algorithms. Computer Science Press, 1998. 266 [212] D. A. Huffman. A method for the construction of minimum-redundancy codes. Proceedings of the IRE, 40(9):10981101, 1952. 454 [213] R. Hughey, A. Krogh. Hidden markov models for sequence analysis: Extension and analysis of the basic method. CABIOS, 12(2):95107, 1996. 577 [214] M. Hujter. Egy ütemezéselméleti probléma vizsgálata és alkalmazásai (Investigation of a scheduling problem and its applications), 1987. Doktori értekezés, ELTE TTK. 414 [215] J. Hunt, T. Szymanski. A fast algorithm for computing longest common subsequences. Communications of the ACM, 20(5):350353, 1977. 576 [216] K. Hwang, Z. Xu. Scalable Parallel Computing. McGraw-Hill, 1998. 267 [217] Interoute. http://wwww.interoute.com/glossary.html, 2004. 221 [218] A. Iványi. On dumpling-eating giants. In Finite and Innite Sets (Eger, 1981), Colloquia of Mathematical Society János Bolyai 37. kötete, 379390. o. North-Holland, 1984. 502 [219] A. Iványi. Performance bounds for simple bin packing algorithms. Annales Universitatis Scientiarum Budapestinensis de Rolando Eötvös Nominatae, Sectio Computarorica, 5:7782, 1984. 502 [220] A. Iványi. Tight worst-case bounds for bin packing algorithms. In Theory of Algorithms (Pécs, 1984), Colloquia of Mathematical Society János Bolyai 44. kötete, 233240. o. North-Holland, 1985. 502 [221] A. Iványi. Párhuzamos algoritmusok (Parallel Algorithms). ELTE Eötvös Kiadó, 2003. 9, 266 [222] A. Iványi, R. Szmeljánszkij. Elements of Theoretical Programming (in Russian). Moszkvai Állami Egyetem, 1985. 502 [223] K. Iwama, S. Tamaki. Improved upper bounds for 3-SAT. Technical Report TR03-053, Electronic Colloquium on Computational Complexity, 2003. 159
Irodalomjegyzék
777
[224] J. R. Jackson. Research Report 43, Management Science Research Project, University of California, 1955. 414 [225] J. R. Jackson. An extension of Johnson's results on job shop scheduling. Naval Research Logistics Quaterly, 3:201224, 1956. 415 [226] A. Jagota, R. B. Lyngso, C. N. S. Pedersen. Comparing a hidden Markov model and a stochastic contextfree grammar. Lecture Notes in Computer Science 2149. kötete, 6984. o. Springer-Verlag, 2001. 578 [227] R. Jain, S. Routhier. Packet trains: Measurements and a new model for computer network traffic. IEEE Journal on Selected Areas in Communication, 4:986995, 1986. 221 [228] J. Jaja. An Introduction to Parallel Algorithms. Addison-Wesley, 1992. 266 [229] M. R. Jerrum. The complexity of nding minimum-length generator sequences. Theoretical Computer Science, 36:265289, 1986. 578 [230] P. Jiménez, F. Thomas, C. Torras. 3D collision detection: A survey. Computers and Graphics, 25(2):269 285, 2001. 683 [231] D. Johnson. Near-optimal bin packing algorithms, 1973. PhD értekezés. 502 [232] S. M. Johnson. Optimal two- and three-stage production schedules with setup times included. Naval Research Logistics Quaterly, 1:6168, 1954. 415 [233] D. S. Johnson, A. Demers, J. D. Ullman, M. R. Garey, R. L. Graham. Worst-case performance-bounds for simple one-dimensional bin packing algorithms. SIAM Journal on Computing, 3:299325, 1974. 502 [234] G. A. Jones, J. Jones. Information and Coding Theory. Springer-Verlag, 2000. 221 [235] K. Jones. Consultant's Guide to COMNET III. CACI Product Company, 1997. 221 [236] S. Kakutani. A generalization of Brouwer's xed point theorem. Duke Mathematical Journal, 8:457459, 1941. 359 [237] M. Kandemir, J. Ramanujam, A. Choudhary. Compiler algorithms for optimizing locality and parallelism on shared and distributed-memory machines. Journal of Parallel and Distributed Computing, 60:924965, 2000. 267 [238] S. Karamardian. The nonlinear complementarity problems with applications. I, II. Journal of Optimization Theory and Applications, 4:8798 and 167181, 1969. 360 [239] Z. Karian, A. Starrett. Use of symbolic computation in probability and statistics. In Z. Karian (szerkeszto), Symbolic Computation in Undergraduate Mathematics Education, number24 in Notes of Mathematical Association of America. Mathematical Association of America, 1992. 93 [240] S. Karlin, M. T. Taylor. A First Course in Stochastic Processes. Academic Press, 1975. 684 [241] R. M. Karp. Reducibility among combinatorial problems. In R. E. Miller, J. W. Thatcher (szerkesztok), Complexity of Computer Computations, 85103. o. Plenum Press, 1972. 158 [242] R. M. Karp, R. E. Miller, S. Winograd. The organization of computations for uniform recurrence equations. Journal of the ACM, 14:563590, 1967. 310 [243] Z. Kása. Combinatorica cu aplica¸tii (Combinatorics with Applications). Presa Universitar a Clujean a, 2003. 37 [244] I. Kátai. Szimuláció (Simulation). Tankönyvkiadó, 1981. 221 [245] J. Köbler, U. Schöning, S. Toda, J. Torán. Turing machines with few accepting computations and low sets for PP. Journal of Computer and System Sciences, 44(2):272286, 1992. 159 [246] J. Köbler, U. Schöning, J. Torán. Graph isomorphism is low for PP. Computational Complexity, 2:301330, 1992. 123, 159 [247] J. Köbler, U. Schöning, J. Torán. The Graph Isomorphism Problem: Its Structural Complexity. Birkhäuser, 1993. 124, 159 [248] A. Kóczy, K. Kondorosi. Operációs rendszerek mérnöki megközelítésben (magyarul: Operating Systems - An Engineering Approach). Panem, 1999. 502 [249] J. Ködmön. Kriptográa: Az informatikai biztonság alapjai, a Pgp kriptorendszer használata (Cryptography: Bases of the Security of Computer Systems. Use of Cryptosystem Pgp). Computerbooks, 2002. 124 [250] J. Kececioglu, H. Lenhof, K. Mehlhorn, P. Mutzel, K. Reinert, M. Vingron. A polyhedral approach to sequence alignment problems. Discrete Applied Mathematics, 104((1-3)):143186, 2000. 576 [251] K. Kennedy, R. Allen. Optimizing Compilers for Modern Architectures. Morgan Kaufman Publishers, 2001. 267
778
Irodalomjegyzék
[252] B. Kernighan, R. Pike. The UNIX programming Environment. Prentice Hall, 1984 (Magyarul: A UNIX operációs rendszer., Muszaki Könyvkiadó, 1987 és 1999). 502 [253] A. Kertész. A térinformatika és alkalmazásai (Geoinformatics and it Applications). Holnap Kiadó, 1997. 716 [254] B. Kiss, A. Krebsz. Játékelmélet (Game Theory). Széchenyi István Foiskola, 1999. 360 [255] S. Kleiman, D. Shah, B. Smaalders. Programming with Threads. Prentice Hall, 1996. 267 [256] L. Kleinrock. Queueing Systems. John Wiley & Sons, 1975 (Magyarul: Sorbanállás kiszolgálás: Bevezetés a tömegkiszolgálási rendszerek elméletébe, http://www.muszakikiado.hu/kezdolap.php Könyvkiadó, 1979). 221 [257] B. Knudsen, J. Hein. Pfold: RNA secondary structure prediction using stochastic context-free grammars. Nucleic Acids Researchs, 31(13):34233428, 2003. 577 [258] D. E. Knuth. Fundamental Algorithms, The Art of Computer Programming 1. kötete. Addison-Wesley, 1968 (3., javított kiadás 1997. Magyarul: A számítógép-programozás muvészete. 1. kötet. Alapveto algoritmusok, Muszaki Könyvkiadó, 1993, 2. kiadás.). 9, 37, 93 [259] D. E. Knuth. Seminumerical Algorithms, The Art of Computer Programming 2. kötete. Addison-Wesley, 1969 (3. javított kiadás 1998. Magyarul: A számítógép-programozás muvészete. 2. kötet. Szeminumerikus algoritmusok, Muszaki Könyvkiadó, 1993, 2. kiadás.). 9, 93 [260] D. E. Knuth. Sorting and Searching, The Art of Computer Programming 3. kötete. Addison-Wesley, 1973 (3., javított kiadás 1997. Magyarul: A számítógép-programozás muvészete. 3. kötet. Keresés és rendezés, Muszaki Könyvkiadó, 1994, 2. kiadás.). 9, 93 [261] D. E. Knuth, J. H. Morris Jr., V. R. Pratt. Fast pattern matching in strings. SIAM Journal on Computing, 6(2):323350, 1977. 576 [262] C. H. Koelbel, D. B. Loveman, R. S. Schreiber, G. Steele Jr., M. E. Zosel. The High Performance Fortran Handbook. The MIT Press, 1994. 267 [263] A. Kovács. Komputer algebra a tudományokban és a gyakorlatban (Computer algebra in science and practice). Alkalmazott Matematikai Lapok, 18:181202, 1994-98. 93 [264] A. Kovács. Computer algebra: Impact and perspectives. Nieuw Archief voor Wiskunde, 17(1):2955, 1999. 93 [265] M. Kovács. Nemlineáris programozás (Nonlinear Programming). Typotex, 1997. 360 [266] G. Krammer. Notes on the mathematics of the PHIGS output pipeline. Computer Graphics Forum, 8(8):219226, 1989. 683 [267] H. W. Kuhn, A. Tucker (szerkesztok). Contributions to the Theory of Games. II. Princeton University Press, 1953. 359 [268] H. T. Kung, C. E. Leiserson. Systolic arrays (for VLSI). In I. S. Duff, G. W. (szerkesztok), Sparse Matrix Proceedings, 256282. o. SIAM, 1978. 310 [269] S. Kurtz, B. Balkenhol. Space efficient linear time computation of the Burrows and Wheeler transformation. In I. Althöfer, N. Cai, L. Dueck, M. Khachatrian, A. Pinsker, I. Sarközy, I. Wegener, Z. Zhang (szerkesztok), Numbers, Information and Complexity, 375383. o. Kluwer Academic Publishers, 2000. 454 [270] R. Ladner. On the structure of polynomial time reducibility. Journal of the ACM, 22(1):155171, 1975. 159 [271] R. Ladner, N. Lynch, A. Selman. A comparison of polynomial time reducibilities. Theoretical Computer Science, 1(2):103124, 1975. 158 [272] B. Lageweg, J. K. Lenstra, A. Rinnoy Kan. Job-shop scheduling by implicit enumeration. Management Science, 24:441450, 1977. 414, 415 [273] B. Lageweg, J. K. Lenstra, A. Rinnoy Kan. A general bounding scheme for the permutation ow-shop problem. Operations Research, 26:5367, 1978. 414 [274] T. Lai, S. Sahni. Anomalies in parallel branch and bound algorithms. Communications of ACM, 27(6):594 602, 1984. 502 [275] J. Lamperti. Stochastic Processes. Springer-Verlag, 1972. 684 [276] G. Lancia. Integer programming models for computational biology problems. Journal of Computer Science and Technology, 19(1):6077, 2004. 576 [277] G. Landau, U. Vishkin. Ecient string matching with k mismatches. Theoretical Computer Science, 43:239 249, 1986. 576 [278] G. Langdon. An introduction to arithmetic coding. IBM Journal of Research and Development, 28:135 149, 1984. 454 [279] R. Laurini, D. Thompson. Fundamentals of Spatial Information Systems. Academic Press, 1992. 716
779
Irodalomjegyzék
[280] A. Law, W. Kelton. Simulation Modeling and Analysis. McGraw-Hill Higher Education, 3. kiadás, 1999. 221 [281] E. L. Lawler. Optimal sequencing of a single machine subject to precedence constraints. Management Science, 19:544546, 1973. 414 [282] E. L. Lawler, J. K. Lenstra, A. H. G. Rinnoy Kan, D. B. Shmoys. Sequencing and scheduling: Algorithms and complexity. In S. C. Graves, A. Kan, P. Zipkin, P. H.szerkesztok), Handbooks in Operations Research and Management Science, Volume 4: Logistics of Production and Inventory, 445522. o. Elsevier, 1993. 413, 414 [283] F. T. Leighton. Introduction to Parallel Algorithms and Architectures: Arrays-Trees-Hypercubes. Morgan Kaufman Publishers, 1992. 266 [284] F. T. Leighton. Introduction to Parallel Algorithms and Architectures: Algorithms and VSLI. Morgan Kaufman Publishers, 2001. 266 [285] W. Leland, M. Taqqu, W. Willinger, D. Wilson. On the self-similar nature of ethernet traffic (extended version). IEEE/ACM Transactions on Networking, 2(1), 1994. 221 [286] W. Leland, M. Taqqu, W. Willinger, D. Wilson. Statistical analysis and stochastic modeling of self-similar The Fundamental Role of Teletraffic in the Evoludata-traffic. In J. Labetoulle, J. W. Roberts (szerkesztok), tion of Telecommunications Networks. Elsevier Science B. V., 1994. 221 [287] W. Leland, M. Taqqu, D. Wilson. On the self-similar nature of ethernet traffic. Computer Communication Reviews, 23, 1993. 221 [288] A. Lenstra, H. Lenstra. The Development of the Number Field Sieve, Lecture Notes in Mathematics 1554. kötete. Springer-Verlag, 1993. 123 [289] C. Leopold. Parallel and Distributed Computing. John Wiley & Sons, Copyrights 2001. 266, 267 [290] B. Lewis, D. J. Berg. Multithreaded Programming with Phtreads. Prentice Hall, 1998. 267 [291] T. Linder, G. Lugosi. Bevezetés Tankönyvkiadó, 1990. 455
az
információelméletbe
(Introduction
to
Information
Theory).
[292] M. Listanti, V. Eramo, R. Sabella. Architectural and technological issues for future optical internet networks. IEEE Communications Magazine, (9):8292, 2000. 221 [293] A. Álmos, S. Gyori, G. Horváth, A. Várkonyiné Kóczy. Genetikus algoritmusok (Genetic Algorithms). Typotex, 2002. 604 [294] P. Longley, D. Maguire, M. Goodschild, D. Rhind. Geographic Information Systems and Science. John Wiley & Sons, 2001. 716 [295] L. Lovász, P. Gács. Algoritmusok (Algorithms). Muszaki Könyvkiadó és Tankönyvkiadó, 1978 és 1987. 9 [296] L. Lovász. Combinatorial Problems and Exercises. Akadémiai Kiadó, 1979 (Magyarul: Kombinatorikai problémák és feladatok, Typotex, 1999). 37 [297] L. Lovász. Algoritmusok bonyolultsága (Complexity of Algorithms). ELTE TTK, 1990. 159 [298] C. Lucchesi. Candidate keys for relations. Journal of of Computer and System Sciences, 17(2):270279, 1978. 534 [299] G. Lunter, I. Miklós, A. Drummond, J. L. Jensen, J. Hein. Bayesian phylogenetic inference under a statistical indel model. Lecture Notes in Bioinformatics, 2812:228244, 2003. 577 [300] G. Lunter, I. Miklós, Y., J. Hein. An efficient algorithm for statistical multiple alignment on arbitrary phylogenetic trees. Journal of Comp. Biology, 10(6):869889, 2003. 577 [301] N. A. Lynch. Distributed Algorithms. Morgan Kaufman Publisher, 2001 (Ötödik kiadás. Magyarul: Osztott algoritmusok. Kiskapu Kiadó, 2002). 9, 311 [302] R. Lyngso, C. N. S. Pedersen. RNA pseudoknot prediction in energy based models. Journal of Comp. Biology, 7(3/4):409428, 2000. 578
[303] R. Lyngso, M. Zuker, C. Pedersen. Fast evaluation of internal loops in RNA secondary structure prediction. Bioinformatics, 15(6):440445, 1999. 578 [304] D. J. Maguire, M. Goodschild, D. Rhind. Geographical Information Systems. Longman, 1991. 716 [305] D. Maier. Minimum covers in the relational database model. Journal of the ACM, 27(4):664674, 1980. 534 [306] D. Maier, A. O. Mendelzon, Y. Sagiv. Testing implications of data dependencies. ACM Transactions on Database Systems, 4(4):455469, 1979. 534 [307] B. Mandelbrot. The Fractal Geometry of Nature. W. H. Freeman, 1982. 221
780
Irodalomjegyzék
[308] B. Mandelbrot, J. W. Van Ness. Fractional brownian motions, fractional noises and applications. SIAM Review, 10:422437, 1968. 221 [309] O. Mangasarian, H. Stone. Two-person zero-sum games and quadratic programming. Journal of Mathematical Analysis and its Applications, 9:348355, 1964. 360 [310] A. S. Manne. On the job-shop scheduling problem. Operations Research, 9:219223, 1960. 414 [311] B. Martos. Nonlinear Programming Theory and Methods. Akadémiai Kiadó, 1975. 360 [312] R. Mathon. A note on the graph isomorphism counting problem. Information Processing Letters, 8(3):131 132, 1979. 159 [313] R. L. Mattson, J. Gecsei, D. R. Slutz, I. Traiger. Evaluation techniques for storage hierarchies. IBM Systems Journal, 9(2):78117, 1970. 501 [314] E. A. Maxwell. Methods of Plane Projective Geometry Based on the Use of General Homogenous Coordinates. Cambridge University Press, 1946. 683 [315] E. A. Maxwell. General Homogenous Coordinates in Space of Three Dimensions. Cambridge University Press, 1951. 683 [316] McAfee. Sniffer technologies. http://www.nai.com/us/index.asp, 2004. 221 [317] J. S. McCaskill. The equilibrium partition function and base pair binding probabilities for RNA secondary structure. Biopolymers, 29:11051119, 1990. 578 [318] G. B. McMahon. Optimal production schedules for ow shops. Canadian Operation Research Society Journal, 7:141151, 1969. 414 [319] R. McNaughton. Scheduling with deadlines loss functions. Management Science, 6:112, 1959. 414 [320] B. Melamed. An overview of tes processes and modeling methodology. In L. Donatiello, A. R. Nelson (szer kesztok), Models and Techniques for Performance Evaluation of Computer and Communications Systems, Lecture Notes in Computer Science, 359393. o. Springer-Verlag, 1993. 221 [321] A. Meskó. A digitális szeizmikus feldolgozás alapjai (Introduction to Processing of Digital Seismic Data). Tankönyvkiadó, 1978. 716 [322] A. Meskó. Geozikai adatfeldolgozás (Processing of Geophysical Data). Tankönyvkiadó, 1983. 716 [323] A. Meyer, L. Stockmeyer. The equivalence problem for regular expressions with squaring requires exponential space. In Proceedings of the 13th IEEE Symposium on Switching and Automata Theory, 125129. o., 1972. 159 [324] I. Meyer, R. Durbin. Comparative ab initio prediction of gene structures using pair HMMs. Bioinformatics, 18(10):13091318, 2002. 576, 577 [325] I. M. Meyer, R. Durbin. Gene structure conservation aids similarity based gene prediction. Nucleic Acids Research, 32(2):776783, 2004. 577 [326] D. Micciancio, S. Goldwasser. Complexity of Lattice Problems: A Cryptographic Perspective, The Kluwer International Series in Engineering and Computer Science 671. kötete. Kluwer Academic Publishers, 2002. 123 [327] R. E. Mickens. Difference Equations. Theory and Applications. Van Nostrand Reinhold, 1990. 37 [328] M. E. Mignotte. Mathematics for Computer Algebra. Springer, 1992. 93 [329] Sz. Mihnovszkij, N. Shor. Estimation of the page fault number in paged memory (in russian). Kibernetika (Kiev), 1(5):1820, 1965. 501 [330] G. L. Miller. Riemann's hypothesis and tests for primality. Journal of Computer and Systems Sciences, 13(3):300317, 1976. 123 [331] W. Miller, E. Myers. A le comparison program. Software Practice and Experience, 15(11):10251040, 1985. 576 [332] W. Miller, E. W. Myers. Sequence comparison with concave weighting functions. Bulletin of Mathematical Biology, 50:97120, 1988. 575 [333] H. Mills. Equilibrium points of nite games. SIAM Journal of Applied Mathematics, 8:397402, 1976. 360 [334] B. E. Mishra. Algorithmic Algebra. Springer, 1993. 93 [335] S. Molnár, A. Vidács, A. Nilsson. Bottlenecks on the way towards characterization of network traffic: Es-
timation and interpretation of the hurst parameter. http://hsnlab.ttt.bme.hu/ molnar (Conference papers), 1997. 221
[336] B. Monien, E. Speckenmeyer. Solving satisability in less than 2 10:287295, 1985. 158, 159
n
steps. Discrete Applied Mathematics,
Irodalomjegyzék
781
[337] B. Morgenstern. DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment. Bioinformatics, 15:211218, 1999. 577 [338] B. Márkus. Térinformatika Magyarországon'94. Technológia Transzfer Centrum, 1994. 716 algoritmusok átlagos bonyolultságának vizsgálata, 1995. Kandidátusi értekezés. [339] G. Márton. Sugárköveto 683 [340] M. Márton, J. Paksi, B. Márkus. Térinformatikai alapismeretek (Elements of Geoinformatics). Technológia Transzfer Centrum, 1994. 716 [341] J. Mészáros. Játékelmélet (Game Theory). Gondolat Kiadó, 2004. 360 [342] J. Nash. Noncooperative games. Annals of Mathematics, 54:286295, 1951. 359 [343] M. Nebel. Identifying good predictions of rna secondary structure. In R. B. Altman, A. K. Dunker, L. Hun ter, T. E. Klein (szerkesztok), Pacic Symposium on Biocomputing, 9. kötet, 423434. o. PSB Online, http://psb.stanford.edu/psb-online/, 2004. 578
[344] S. N. Needleman, C. Wunsch. A general method applicable to the search for similarities in the amino acid sequence of two proteins. Journal of Molecular Biology, 48:443453, 1970. 575 [345] M. Nelson, J. L. Gailly. The Data Compression Book. M&T Books, 1996. 455 [346] J. Neumann, O. Morgenstern. Theory of Games and Economical Behaviour. Princeton University Press, 1947 (2. kiadás). 360 [347] M. F. Neuts. A versatile markovian point process. Journal of Applied Probability, 18:764779, 1979. 221 [348] M. F. Neuts. Structured Stochastic Matrices of M/G/1 Type and Their Applications. Marcel Dekker, 1989. 221 [349] M. E. Newell, R. G. Newell, T. L. Sancha. A new approach to the shaded picture problem. In Proceedings of the ACM National Conference, 443450. o., 1972. 684 [350] H. Nikaido, K. Isoda. Note on noncooperative games. Pacic Journal of Mathematics, 5:807815, 1955. 360 [351] S. Oaks, H. Wong. Java Threads. O'Reilly, 1999. 267 [352] A. Odlyzko. Applications of Symbolic Mathematics to Mathematics. Kluwer Academic Publishers, 1985. 93 [353] K. Okuguchi. Expectation and Stability of Oligopoly Models. Springer, 1976. 360 [354] K. Okuguchi, F. Szidarovszky. The Theory of Oligopoly with Multi-Product Firms. Springer, 1999 (2. kiadás). 360 [355] OpenMP Website. http://www.openmp.org, 2004. 267 [356] OPNET. Opnet Modeler Documentation. www.opnet.com, 2004. 221 [357] J. O'Rourke. Art Gallery Theorems and Algorithms. Oxford University Press, 1987. 683 [358] C. H. Papadimitriou. Computational Complexity. Addison-Wesley, 1994 (Magyarul: Kiszámítási bonyolultság, Novadat, 1999). 124, 158, 159 [359] C. Partridge. The end of simple traffic models. IEEE Network, (9), 1993. Editor's Note. 221 [360] R. Pasco. Source Coding Algorithms for Fast Data Compression. PhD thesis, Stanford University, 1976. 454 [361] R. Paturi, P. Pudlák, M. Saks, F. Zane. An improved exponential-time algorithm for k-SAT. In Proceedings of the 39th IEEE Symposium on Foundations of Computer Science, 628637. o. IEEE Computer Society Press, 1998. 159 [362] R. Pavelle, M. Rothstein. Computer algebra. Scientic American, 245(12):102113, 1981. 93 [363] V. Paxson, S. Floyd. Wide-area traffic: The failure of Poisson modelling. IEEE/ACM Transactions on Networking, 3(3):226244, 1995. 221 [364] J. S. Pedersen J. Hein. Gene nding with a hidden Markov model of genome structure and evolution. Bioinformatics, 19(2):219227, 2003. 577 [365] I. Peák. Bevezetés az automaták elméletébe. Az automaták mint információátalakító rendszerek 1. (Introduction to the Theory of Automata. Automata an Systems for the Transformation of the Information). Tankönyvkiadó, 1977. 501 [366] G. Perlman. HCI bibliography, 2004. 604 [367] S. Petrov. Finite axiomatization of languages for representation of system properties. Information Sciences, 47:339372, 1989. 534 [368] P. A. Pevzner. Computational Molecular Biology: An Algorithmic Approach. The MIT Press, 2000. 576
782
Irodalomjegyzék
[369] G. F. Pster. In Search of Clusters. Prentice Hall, 1998 (2. kiadás). 267 [370] J. Piehler. Ein Beitrag zum Reihenfolgeproblem, Unternehmensforschung. Unternehmerforschung, 4:138 142, 1960. 414 [371] M. Pinedo. Scheduling: Theory, Algorithms and Systems. Pearson Education, 2001 (2. kiadás). 415 [372] M. Pinedo. Planning and Scheduling in Manufacturing and Services. Springer-Verlag, 2004 (megjelenoben). 415 [373] N. Pisanti, M. Sagot. Further thoughts on the syntenic distance between genomes. Algorithmica, 34(2):157 180, 2002. 578 [374] J. Podani. Bevezetés a többváltozós biológiai adatfeltárás rejtelmeibe. Scientia, 1997. 576, 604 [375] J. M. Pollard. Theorems on factorization and primality testing. Proceedings of the Cambridge Philosophical Society, 76:521528, 1974. 123 [376] F. P. Preparata, M. I. Shamos. Computational Geometry: An Introduction. Springer-Verlag, 1985. 683 [377] A. Prékopa. Valószínuségelmélet muszaki alkalmazásokkal. Muszaki Könyvkiadó, 1962. 221 [378] T. Pupko, I. Peer, R. Shamir, D. Graur. A fast algorithm for joint reconstruction of ancestral amino acid sequences. Molecular Biology and Evolution, 17:890896, 2000. 577 [379] P. Quinton. Automatic synthesis of systolic arrays from uniform recurrent equations. In Proceedings of the 11th Annual International Symposium on Computer Architecture, 208214. o., 1984. 310 [380] M. Rabi, A. Sherman. An observation on associative one-way functions in complexity theory. Information Processing Letters, 64(5):239244, 1997. 123 [381] M. O. Rabin. Probabilistic algorithms for testing primality. Journal of Number Theory, 12(1):128138, 1980. 123 [382] R. Rao, J. Rothe, O. Watanabe. Upward separation for FewP and related classes. Information Processing Letters, 52(4):175180, 1994 (Corrigendum appears in the same journal,74(12):89, 2000). 159 [383] S. K. Rao. Regular iterative algorithms and their implementations on processor arrays. Doktori értekezés, Stanford University, 1985. 310 [384] P. Resnick, H. R. Varian. Recommender Systems. Communications of the ACM, 40(3):5658, 1997. 604 [385] J. Richards. Remote Sensing Digital Image Analysis. Springer-Verlag, Australia, 1986. 716 [386] P. Rigaux, M. Scholl, A. Voisard. Spatial Databases with Application to GIS. Morgan Kaufman Publisher, 2001. 716 [387] J. Rissanen, G. Arithmetic coding. IBM Journal of Research and Development, 23:149162, 1979. 454 [388] J. J. Rissanen. Generalized Kraft inequality and arithmetic coding. IBM Journal of Research and Development, 20:198203, 1976. 454 [389] J. Ritt. Integration in Finite Terms. Columbia University Press, 1948. 92 [390] E. Rivas, S. Eddy. A dynamic programming algorithm for RNA structure prediction including pseudoknots. Journal of Molecular Biology, 285(5):20532068, 1999. 578 [391] R. L. Rivest, A. Shamir, L. M. Adleman. A method for obtaining digital signatures and public-key cryptosystems. Communications of the ACM, 21(2):120126, 1978. Lásd még az U.S. Patent 4 405 829 számú szabadalmat. 123 [392] L. Rónyai, G. Ivanyos, R. Szabó. Algoritmusok (Algorithms). Typotex, 1999. 9, 159 [393] A. Rényi. Probability Theory. Akadémiai Kiadó/North Holland Publ. House, 1970 (Magyarul: Valószínu ségelmélet, Tankönyvkiadó, Budapest, 1973). 221 [394] J. Robinson. An iterative method of solving a game. Annals of Mathematics, 154:296301, 1951. 360 [395] D. F. Rogers, J. Adams. Mathematical Elements for Computer Graphics. McGraw-Hill, 1989. 683 [396] S. H. Roosta. Parallel Processing and Parallel Algorithms. Springer-Verlag, 1999. 266, 502 [397] J. Rosen. Existence and uniqueness of equilibrium points for concave n-person games. Econometrica, 33:520534, 1965. 360 [398] J. Rothe. Some facets of complexity theory and cryptography: A ve-lecture tutorial. ACM Computing Surveys, 34(4):504549, 2002. 123, 124 [399] J. Rothe. A promise class at least as hard as the polynomial hierarchy. Journal of Computing and Information, 1(1):92107, 1995. 159 [400] J. Rothe. Complexity Theory and Cryptology. An Introduction to Cryptocomplexity. EATCS Texts in Theoretical Computer Science. Springer-Verlag, 2005. 158, 159
783
Irodalomjegyzék
[401] M. H. Rothkopf. Scheduling independent tasks on parallel machines. Management Science, 12:437447, 1966. 414 [402] R. O. Roundy, W. L. Maxwell, Y. T. Herer, S. R. Tayur, A. W. Getzler. A price-directed approach of production operations. IIE Transactions, 23:149160, 1991. 415 [403] B. Roy, B. Sussmann. Les problémes d'ordonnuncement avec contraintes disjonctives. Note DS no. 9 bis, SEMA, 1964. 414 [404] S. Sahni. Algorithms for scheduling independent tasks. Journal of the ACM, 23:116127, 1976. 414 [405] S. Sahni. Preemptive scheduling with due dates. Operations Research, 27:929934, 1979. 414 [406] A. Sali, Sr., A. Sali. Generalized dependencies in relational databases. Acta Cybernetica, 13:431438, 1998. 535 [407] A. Salomaa. Public-Key Cryptography, EATCS Monographs on Theoretical Computer Science 23. kötete. Springer-Verlag, 2. kiadás, 1996. 122, 123 [408] D. Salomon. Data Compression. Springer-Verlag, 2004 (3. kiadás). 455 [409] J.
Sameith.
On
the
generation
of
alternative
solutions
for
discrete
problems with uncertain data an experimental analysis of the http://www.minet.uni-jena.de/Math-Net/reports/shadows/04-01report.html, 2004. 604
optimization
penalty
method.
[410] H. Samet. The quadtree and related hierarchical data structures. ACM Computer Surveys, 16(2):187260, 1984. 716 [411] D. Sankoff. Minimal mutation trees of sequences. SIAM Journal of Appliedl Mathematics, 28:3542, 1975. 575 [412] L. A. Santaló. Integral Geometry and Geometric Probability. Addison-Wesley, 1976. 684 [413] K. Sayood. Introduction to Data Compression. Morgan Kaufman Publisher, 2000 (2. kiadás). 455 [414] U. Schöning. A low and a high hierarchy within NP. Journal of Computer and System Sciences, 27:1428, 1983. 159 [415] U. Schöning. Graph isomorphism is in the low hierarchy. Journal of Computer and System Sciences, 37:312323, 1987. 159 [416] U. Schöning. A probabilistic algorithm for k-SAT based on limited local search and restart. In Proceedings of the 40th IEEE Symposium on Foundations of Computer Science, 410414. o. IEEE Computer Society Press, 1999. 158, 159 [417] U. Schöning. Algorithmik. Spektrum Akademischer Verlag, 2001. 160 [418] U. Schöning. Ideen der Informatik. Oldenbourg Verlag, 2002. 158 [419] L. Schrage. Solving resource-constrained network problems by implicit enumeration. Operations Research, 18:263278, 1970. 414 [420] L. Schrage. Obtaining optimal solutions to resource constrained network scheduling problems, 1971. Publikálatlan kézirat. 414 [421] R. Sedgewick, P. Flajolet. An Introduction to the Analysis of Algorithms. Addison-Wesley, 1996. 37 [422] R. Seidel. A simple and fast incremental randomized algorithm for computing trapezoidal decompositions and for triangulating polygons. Computational Geometry: Theory and Applications, 1(1):5164, 1991. 683 [423] A. Selman. Polynomial time enumeration reducibility. SIAM Journal on Computing, 7(4):440457, 1978. 158 [424] C. Semple, M. Steel. Phylogenetics. Number24 in Oxford Lecture Series in Mathematics and Its Applications. Oxford Press, 2003. 576 [425] A. Shamir. IP
= PSPACE.
Journal of the ACM, 39(4):869877, 1992. 123
[426] C. Shannon. Communication theory of secrecy systems. Bell System Technical Journal, 28(4):657715, 1949. 123 [427] H. N. Shapiro. Note on a computation method in the theory of games. Communications on Pure and Applied Mathematics, 11:587593, 1958. 360 [428] B. Sharp. Implementing subdivision theory. Game Developer, 7(2):4045, 2000. 683 [429] B. Sharp. Subdivision Surface theory. Game Developer, 7(1):3442, 2000. 683 [430] I. Shindyalov, P. Bourne. Protein structure alignment by incremental combinatorial extension (CE) of the optimal path. Protein Engineering, 11(9):739747, 1998. 577 [431] A. Silberschatz, P. Galvin, G. Gagne. Applied Operating System Concepts. John Wiley & Sons, 2000. 501
784
Irodalomjegyzék
[432] D. Sima, T. Fountain, P. Kacsuk. Advanced Computer Architectures: a Design Space Approach. AddisonWesley Publishing Company, 1998 (2. kiadás. Magyarul: Korszeru számítógéparchitektúrák tervezésitérmegközelítésben. Szak Kiadó, 1998). 221, 266, 311 [433] S. Singh. The Code Book. The Secret History of Codes and Code Breaking. Fourth Estate, 1999 (Magyarul: Kódkönyv. A rejtjelezés és rejtjelfejtés története. Park Könyvkiadó, 2002). 123, 124 [434] W. Smith. Various optimizers for single-stage production. Naval Research Logistics Quaterly, 3:5966, 1956. 414, 415 [435] M. Snir, S. W. Otto, S. D. W. Huss-Lederman, D. W. Walker, J. Dongarra. MPI: The Complete Reference. The MIT Press, 1996. 267 [436] R. Solovay, V. Strassen. A fast Monte Carlo test for primality. SIAM Journal on Computing, 6:8485, 1977. Erratum appears in the same journal, 7(1):118, 1978. 123 [437] G. Stephen. String searching algorithms, Lecture Notes Series on Computing 3. kötete. World Scientic, Singapore, 1994. 576 [438] R. Stephens. Visual Basic Graphics Programming. John Wiley & Sons, 2000. 716 [439] D. Stinson. Cryptography: Theory and Practice. CRC Press, 2002 (2. kiadás). 123 [440] L. Stockmeyer. The polynomial-time hierarchy. Theoretical Computer Science, 3(1):122, 1977. 159 [441] G. Stoyan (szerkeszto). MATLAB 4. és 5. verzió. Typotex, 1999. 765 [442] I. Sutherland, G. Hodgeman. Reentrant polygon clipping. Communications of the ACM, 17(1):3242, 1974. 683 [443] I. E. Sutherland, R. Sproull, R. Schumacker. A characterization of ten hidden-surface algorithms. Computing Surveys, 6(1):155, 1974. 684 Graphics Programming Methods. [444] L. Szécsi. An effective kd-tree implementation. In J. Lander (szerkeszto), Charles River Media, 2003. 684 [445] F. Szidarovszky, C. Chiarella. Dynamic oligopolies, stability and bifurcation. Cubo Mathemática Educational, 3(2):267284, 2001. 360 [446] F. Szidarovszky, S. Molnár. Játékelmélet muszaki alkalmazásokkal: Többcélú programozás, klasszikus és differenciáljátékok (Game Theory with Technical Applications: Programming with Multiple Aims, Classical Könyvkiadó, 1986. 360 and Differential Games). Muszaki
[447] F. Szidarovszky, S. Yakowitz. Principles and Procedures of Numerical Analysis. Plenum Press, 1998. 360 [448] L. Szirmay-Kalos. Számítógépes graka (Computer Graphics). ComputerBooks, 1999. 684 Theory of Three Dimensional Computer Graphics. Akadémiai Kiadó, 1995. [449] L. Szirmay-Kalos (szerkeszto). 684 [450] L. Szirmay-Kalos, Gy. Antal, F. Csonka. Háromdimenziós graka, animáció és játékfejlesztés
+ CD (Three
Dimensional Graphics, Animation and Game Development). Computerbooks, 2003. 683, 684 [451] L. Szirmay-Kalos, G. Márton. Worst-case versus average-case complexity of ray-shooting. Computing, 61(2):103131, 1998. 683 [452] J. Sztrik. Bevezetés a sorbanállási elméletbe és alkalmazásaiba. http://irh.inf.unideb.hu/user/jsztrik/, 2004. 221 [453] W. Szwarc. Optimal elimination methods in the m × n sequencing problem. Operations Research, 21:1250 1259, 1973. 414 [454] W. Szwarc. Dominance conditions for the three-machine ow-shop problem. Operations Research, 26:203 206, 1978. 414 [455] W. Szwarc. Elimination methods in the m × n sequencing problem. CWI Quarterly, 18:295305, 1971. 414 [456] A. S. Tanenbaum. Modern Operating Systems. Prentice Hall, 2001. 267 [457] A. S. Tanenbaum. Computer Networks. Prentice Hall, 2004 (4. kiadás. Magyarul: Számítógép-hálózatok. Panem, 2004). 221 [458] A. S. Tanenbaum, M. van Steen. Distributed systems. Principles and Paradigms. Prentice Hall, 2002 (Magyarul: Elosztott rendszerek. Panem, 1999). 267 [459] A. S. Tanenbaum, A. Woodhull. Operating Systems. Design and Implementation. Prentice Hall, 1997 (Magyarul: Operációs rendszerek. Panem, 1999). 501, 502 [460] M. Taqqu, W. Teverovsky, W. Willinger. Estimators for long-range dependence: an empirical study. Fractals, 3(4):785788, 1995. 221
Irodalomjegyzék
785
[461] A. Tarski. A lattice-theoretical xpoint theorem and its application. Pacic Journal of Mathematics, 5:285 308, 1955. 359 [462] D. S. Taubman, M. W. Marcelin. JPEG 2000 Image Compression, Fundamentals, Standards and Practice. Society for Industrial and Applied Mathematics, 1983. 455 [463] J. Teich, L. Thiele. Control generation in the design of processor arrays. International Journal of VLSI and Signal Processing, 3(2):7792, 1991. 310 [464] B. Thalheim. Dependencies in Relational Databases. Teubner Verlagsgesellschaft, 1991. 535 [465] J. D. Thompson, D. G. Higgins, T. J. Gibson. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specic penalties and weight matrix choice. Nucleic Acids Research, 22:46734680, 1994. 575 [466] I. Tinoco, O., Uhlenbeck M. Levine. Estimation of secondary structure in ribonucleic acids. Nature, 230:362367, 1971. 577 [467] Top 500 Supercomputer Sites. http://www.top500.org, 2004. 266 [468] Trusoft Intl Inc.. Benoit 1.1. Trusoft Intl Inc., 2004. 221 [469] D. M. Tsou, P. C. Fischer. Decomposition of a relation scheme into BoyceCodd normal form. SIGACT News, 14(3):2329, 1982. 534 [470] A. Turing. On computable numbers, with an application to the Entscheidungsproblem. Proceedings of the London Mathematical Society, ser. 2, 2:230265, 1936 (Correction, ibid, vol. 43, pp. 544546, 1937). 158 [471] Y. Uemura, A. Hasegawa, Y. Kobayashi, T. Yokomori. Tree adjoining grammars for RNA structure prediction. Theoretical Computer Science, 210:277303, 1999. 578 [472] J. J. Uhl. M and Me. Notices of AMS, 35:13451345, 1988. 93 [473] J. D. Ullman. Principles of Database and Knowledge Base Systems. Vol. 1. Computer Science Press, 2. kiadás, 1989. 535 [474] J. D. Ullman, J. . A First Course in Database Systems. Prentice Hall, 1997 (Magyarul: Adatbázisrendszerek. Alapvetés. Panem, Budapest, 1998). 535 [475] L. G. Valiant. The relative complexity of checking and evaluating. Information Processing Letters, 5(1):20 23, 1976. 159 [476] L. G. Valiant. A bridging model for parallel computation. Communications of the ACM, 33(8):103111, 1990. 267 [477] L. Varga.
Rendszerprogramok elmélete és gyakorlata (Theory and Practice of System Programs).
Akadémiai Kiadó, 1980. 502 [478] N. J. Vilenkin. Kombinatorika (oroszul). Mir, 1969 (Angolul: Combinatorial Mathematics, Mir, 1972; magyarul: Kombinatorika, Muszaki Könyvkiadó, 1987, 2. kiadás). 37 [479] B. Vizvári. Egészértéku programozás. ELTE TTK, 1990. 414 [480] J. von zur Gathen. Modern Computer Algebra. Cambridge University Press, 2003. 92, 93 [481] T. Várady, R. R. Martin, J. Cox. Reverse engineering of geometric models - an introduction. ComputerAided Design, 29(4):255269, 1997. 683 [482] K. Wagner, G. Wechsung. Computational Complexity. D. Reidel Publishing Company, 1986 (and Kluwer Academic Publishers, 2001). 158 [483] G. Wallace. The JPEG still picture compression standard. Communications of the ACM, 34:3044, 1991. 455 [484] L. Wang, T. Jiang. On the complexity of multiple sequence alignment. Journal of Computatonal Biology, 1:337348, 1994. 575 [485] J. Warren, H. Weimer. Subdivision Methods for Geometric Design: A Constructive Approach. Morgan Kaufmann Publishers, 2001. 683 [486] M. S. Waterman. Efficient sequence alignment algorithms. Journal of Theoretical Biology, 108:333337, 1984. 575 [487] M. S. Waterman, T. F. Smithand, W. A. Beyer. Some biological sequence metrics. Advances in Mathematics, 20:367387, 1976. 575 [488] D. Watkins. Bulge exchanges in algorithms of QR type. SIAM Journal on Matrix Analysis and Application, 19(4):10741096, 1998. 765 [489] Web Dictionary of Cybernetics, Systems. http://pcp.wub.ac.be/ASC.html, 2004. 221 [490] G. Wechsung. Vorlesungen zur Komplexitätstheorie, 32. kötet. B. G. Teubner Verlagsgesellschaft, 2000. 158
786
Irodalomjegyzék
[491] D. Welsh. Codes and Cryptography. Oxford University Press, 1988. 454 [492] J. Wilkinson. Convergence of the LR, QR, and related algorithms. The Computer Journal, 8(1):7784, 1965. 765 [493] F. M. J. Willems, Y. M. Shtarkov, T. J. Tjalkens. The context-tree weighting method: basic properties. IEEE Transactions on Information Theory Theory, 47:653664, 1995. 454 [494] F. M. J. Willems, Y. M. Shtarkov, T. J. Tjalkens. The context-tree weighting method: basic properties. IEEE Information Theory Society Newsletter, 1:1 és 2027, 1997. 454 [495] W. Willinger, V. Paxson. Discussion of heavy tail modeling and teletraffic data by S. R. Resnick. The Annals of Statistics, 25(5):18051869, 1997. 221 [496] W. Willinger, M. Taqqu, R. Sherman, D. Wilson. Self-similarity through high-variability: statistical analysis of Ethernet LAN traffic at the source level. IEEE/ACM Transactions on Networking, 5:7186, 1997. 221 [497] W. Willinger, D. Wilson, W. Leland, M. Taqqu. On traffic measurements that defy traffic models (and vice versa): self-similar traffic modeling for high-speed networks. Connections, 8(11):1424, 1994. 221 [498] F. Winkler. Polynomial Algorithms in Computer Algebra. Springer-Verlag, 1990. 93 [499] I. H. Witten, R. M. Neal, J. G. Cleary. Arithmetic coding for sequential data compression. Communications of the ACM, 30:520540, 1987. 454 [500] M. J. Wolfe. High Performance Compilers for Parallel Computing. Addison Wesley Longman, 1996. 267 [501] S. Wu, E.. W. Myers, U. Manber, W. Miller. An O(NP) sequence comparison algorithm. Information Processing Letters, 35(6):317323, 1990. 576 [502] G. Wyvill, C. McPheeters, B. Wyvill. Data structure for soft objects. The Visual Computer, 4(2):227234, 1986. 683 [503] D. M. Young. Iterative Solution of Large Linear Systems. Academic Press, 1971 (Magyarul: Nagy lineáris rendszerek iterációs megoldása. Muszaki Könyvkiadó, 1979). 765 [504] C. Yu, D. Johnson. On the complexity of nding the set of candidate keys for a given set of functional dependencies. In Information Processing 74, 580583. o. North-Holland, 1974. 534 [505] S. Zachos, H. Heller. A decisive characterization of BPP. Information and Control, 69:125135, 1986. 124 [506] B. Zalik, G. Clapworthy. A universal trapezoidation algorithms for planar polygons. Computers and Graphics, 23(3):353363, 1999. 683 [507] C. Zaniolo. Analysis and design of relational schemata for database systems. Technical Report UCLA Eng7669, Department of Computer Science, University of California at Los Angeles, 1976. 534 [508] C. Zaniolo. A new normal form for the design of relational database schemata. ACM Transactions on Database Systems, 7:489499, 1982. 534 [509] E. Zehendner. Entwurf systolischer Systeme: Abbildung regulärer Algorithmen auf synchrone Prozessorarrays. B. G. Teubner Verlagsgesellschaft, 1996. 310 [510] J. Ziv, A. Lempel.
A universal algorithm for sequential data compression. IEEE Transactions on
Information Theory Theory, 23:337343, 1977. 454 [511] J. Ziv, A. Lempel. Compression of individual sequences via variable-rate coding. IEEE Transactions on Information Theory Theory, 24:530536, 1978. 454 [512] S. I. Zuhovitsky, R. A. Polyak, M. E. Primak. Concave n-person games (numerical methods). Ékonomika i Matematicheskie Methody, 7:888900, 1971 (oroszul). 360 [513] M. Zuker, D. Sankoff. RNA structures and their prediction. Bulletin of Mathematical Biology, 46:591621, 1986. 578 [514] AND Software GmbH. Car routing program Route Germany, 1997. 604
Tárgymutató
A, Á
frissítési, 512
AABB, 635 abszolút hiba, 726gy
redundancia, 512 törlési, 512
abszolút hibakorlát, 717
anomálisa mértéke, 481
abszolút optimális algoritmus, 234
áramlási problémához, 595
absztrakt számítógép, lásd számítási modell környezet ACE, lásd Alkalmazásjellemzo
architektúra szisztolikus, 275
adatábrázolás a komputeralgebrában, 40
A- ´ , 431 ´ aritmetikai kódolás, 429
Adatcsere diagram, 184
A- ´ , 431 ´
adatfolyam, 284 adatfolyam iránya, 287 adatfüggoség, 284
aritmetikai túlcsordulás, 726gy Armstrong-axiómák, 504, 507, 511gy, 519
adatpárhuzamosság, 228, 235
árnyék, 645
adatsebesség, 291
asszociativitás, 101, 116gy
adatszerkezet indexe, 287 adatszerkezet vektor, 287
aszimptotikusan azonos nagyságrend, 234 aszimptotikusan optimális algoritmus, 234
additív metrika, 566
aszimptotikusan önhasonló folyamat, 196 blokk Jacobi-multifelbontás, 739 átfedo
affin függvény, 542
affin transzformáció, 643 aktív él lista, 674 alakzat, 605
Armstrong-reláció, 532
átfordulási probléma, 668 391 átfutási ido, programok, 456 áthelyezheto
alaphalmaz, 588
átlagos, 232
algebrai 76, 79, 80, 83, 86 bovítés, elem, 78
átlagos kódhossz, 421 átlapolás, 366, 379
számtest, 79, 81 algoritmus
átló, 548, 620 átlósan szigorúan konkáv, 342 átmenet
abszolút optimális, 234 aszimptotikusan optimális, 234 munkahatékony, 233 algoritmus stabilitása, 739 környezet, 182 Alkalmazásjellemzo
testek közötti, 618 átmenetfüggvény, 472 alternatívák, 580 áttekintheto attribútum, 238, 503 533fe külso,
állandó kommunikáció, 237 állapot-átmenetfüggvény, 471 366 állásido, algoritmus, 499 állományelhelyezo
prím, 520, 534fe automatikus párhuzamosítás, 235 axiómarendszer ellentmondásmentes, 504 teljes, 505
alsó-hierarchia, 144, 149áb, 150 általános kiválasztási feladat, 262
axiomatizálás, 531
általános megoldás, 14 általános párhuzamos gépek, 366
azonnali kód, lásd prex kód
alternatívák, valódi, 581 alternatív áram együttható, 450
B
alternatív megoldások, 600 alulcsordulás, 433 705, 706áb alulvágó szur o,
B, 556
Amdahl-törvény, 229
BSAT, 140, 144gy
balsodrású, 669
analitikus geometria, 605
báziscímzés, 456 bázisfüggvény, 610
anomália, 480, 481, 501, 511, 519
bázisregiszter, 456
beillesztési, 512
bázisvektor, 606
788
Tárgymutató
be/kimeneti adatsebesség, 307, 308
cellaszerkezet, 269áb, 279áb, 285
be/kiviteli séma, bovített, 292 be/kivitel kiterjesztése, 291, 292
CGS- ´ ´-GS- ´ ´,
be/kiviteli séma, 287, 288áb bovített, 291, 292áb
C, 565, 688 CGS--GS- ´ ´, 754
befoglaló keret, 648
755
AABB, 648 gömb, 648
Cholesky-felbontás, 734, 737, 764fe C- , 735 ´
hierarchikus, 648
Chomsky-féle normálforma, 557
befoglaló téglalap, 688, 689áb
Church-tézis, 126, 133gy
BellmanFord-algoritmus, 266 pont, 607 belso
CIR, lásd információátviteli intenzitással
¨ , 557
Clustal-W, 542, 575 CS-- ´ ´ , 637
bemeneti adatfolyam, 276
CohenSutherland szakaszvágó algoritmus, 636
bemeneti csatorna, 270 jelek halmaza, 471 bemeno
COMNET, 173
Bernstein-polinom, 611 B-, 469gy
CRAY, 723 CRCW, 261
B , 585 ´ ´ -- ´ - ¨ ¨ - ´ ´ beszúró rendezés, 308 beviteli séma, 269áb
CoxdeBoor-algoritmus, 614
CRCW PRAM, 242, 266 CREW PRAM, 242, 244 CYK-algoritmus, 557
Bézier-görbe, 611, 618gy BF, 493, 494, lásd gazdaságos algoritmus gazdaságos algoritmus BFD, lásd rendezo
CS
bimátrix-játék, 328
csatorna, 270
bináris fák
csavarvonal, 609 csendes állapot, 559
megszámolása, 28 bináris térpartícionáló fa, 658
csepp módszer, 616
binomiális képlet általánosítása, 26 BLOSUM, 546
CSG, lásd konstruktív tömörtest geometria CSG-fa, 617áb, 800
Bluetooth, 168
*-, 472
bonyolultságelmélet,
csomag, 168
B ´-E, 45, 63gy, 92
B ´-E- ´ , 47, 63gy Bresenham-algoritmus, 671, 672 B- ´ , 673
csomag érkezési idoköz, 199 csomópontszerkesztovel, 180 csomóvektor, 612 csoport, 101
BSP, 242
generátorrendszer, 103
BSP-fa, 658, 681 BSP-- ´ ´ ´ , 681
kommutatív, 101 rend, 101
B-spline, 612, 614 rendszám, 612
C , 565 ´ csúszó ablak, 441
buborékrendezés, 307, 308áb BurrowsWheeler-transzformáció, 443 B ´ --´ - - ¨ ¨ ¨ - ´ ´ -
´ ,
599 büntetés-optimális, 590 függvény bünteto additív büntetés, 600 tag, 588 additív bünteto tényezo, 587, 590 relatív bünteto módszer, 586, 587, 589 bünteto módszer, iteratív, 594 bünteto
B - -´- -´ , ¨ ´ ¨ 587 paraméter, optimális, 592, 599 bünteto BWT- ´ , 444 ´ BWT- ´ , 444 ´
D DCT, 448
DDA, lásd digitális differenciális analizátor algoritmus
DDA- ´ , 671 deriválás, 73 Descartes-koordináta, 606 Descartes-koordinátarendszer, 606 determinisztikus idobonyolultság, 130 determinisztikus Turing-gép, 127 D-, 248, 249, 250
D-- , 759 ´ ´ ´ - - ´ D-- , 759 ´ ´ ´ - - ´ DiAligh, 548 DiAlign, 576 Dickson-lemma, 67, 71gy
differenciálalgebra, 72 C
differenciálás, 73
97 Caesar-rejtjelezo, Canny-féle éldetektor, 708
szabályai, 73 differenciálbovítés, 73
CatmullClark-felosztás, 624áb CatmullClark felosztott felület, 625 ccNUMA, 224 cella, 269, 689 vezérlésmentes, 295 cellaprogram, 303, 304, 305
differenciál-kiterjesztés, 80 differenciálrésztest, 73
differenciáltest, 72 bovítése, 73 differenciálbovítése, 78
DiffieHellman-protokoll, 94
789
Tárgymutató
digitális differenciális analizátor algoritmus, 670 digitális szurés, 695
o szur 706 élmegorz o, elobetöltés, 470
dinamikus programozás, 584
E ¨ , 557
diszkrét emlékezet nélküli forrás, 419 diszkrét idoszelet, 274
E , 543
Dirac-δ, 699 direkt hiba, 719
diszkrét koszinusz transzformáció, 448 diszkrét logaritmus, 108 diszkrimináns, 63gy DMS, lásd diszkrét emlékezet nélküli forrás
E - ´ , 446 elore-mozgató kód, 445 E - , 545 ´ elozéses egyutas ütemezési probléma, 391 elozésnélküli egyutas ütemezési probléma, 391 élpont, 625 eltolás, 441, 605
döntéshozó, 581
E -QR- , 757 ´ ´ eltolásos QR-módszer, 758gy
döntési változó, 672 duál feladat (az egyutas ütemezési problémáé), 391
ember-gép kölcsönhatás, 580 708, 710áb, 804áb emboss-szur o,
duális fa, 622
emuláció, 166
DNS, 538
entrópia, 420 EP, lásd gazdaságos hatványtípusú algoritmus E, É EDD, 373, 410, lásd legkorábbi határido egészértéku lineáris programozás, 599
E , 261, 262 ´ - ´ egész számok, 39 egy (régi) op, 732 egy (új) op, 732 egyenáram együttható, 450 egyenes, 609 egyenlete, 609 helyvektora, 609 irányvektora, 609 egyenes egyenlete, 640
homogén koordinátákban, 641 egyenlet megoldása, 273 E ´, 514
egyértelmu egyensúly, 343 egyértelmuen dekódolható kód, 421 egyidejuség, 274 egyirányú függvény, 108 rögzítések, 602 egymást követo egységcsoport, 121 egység háromszögmátrix, 732 egységnyi kerekítés mértéke, 722 sokszög, 619 egyszeresen összefüggo egyszeru, 619
ε-alternatívák, 589, 592
monotonitási tulajdonságai, 593 unimodalitási tulajdonság, 592 ERCW PRAM, 242 EREW PRAM, 242, 265 EREW-, 244, 246 érintosík egyenlete, 609 eroforrás, 364, 366 generátor, 103 eros
ingadozás, 171 eros ingadozás érkezési idoköz, eros 199 érték, 332 értékadásmentes jelölés, 273 értéktartomány, 273 sur u konvex, 281 értéktartomány transzformációja, 303 értelmezési tartomány, 503 Euler-féle ϕ függvény, 102 exponenciális elem, 78
F fa, 122 levél, 122
F´ -´ -´ -´-´ ´´ , 601 Fan-egyenlotlenség, 323
egyszeru algoritmus, 252 egyszeru algoritmus (NF), 492
fekete doboz modellezés, 198 feladat paraméterei, 271
Egyszeru hálózati menedzsment protokoll, 190
felmelegedési periódus, 192 és alsó becslések, 496 felso
E , 565 - ´
egyszeru hatvány algoritmus (SP), 495 E , 565 - ´ egyszeru sokszög, 619
egyutas ütemezési probléma, 366, 389 EH-´ ´, 61 e-kereskedelem, 583
éldetektálás, 707, 708 eldobott csomagok aránya, 172 elem invertálható, 101 inverz, 101 elemi függvénytest, 78, 79, 81 kiterjesztés, 78 elemi függvény, 78 integrálása, 79 elem rangja, 247 Elemzoeszköz, 181
E, 464, 470gy ellipszis, 609
félcsoport, 101
Hessenberg-alak, 757 felso felso-hierarchia, 144, 149áb, 150 Felsooktatási Pályázatok Irodája, 4 felület, 607 705 felülvágó szur o, fényesség, 448 algoritmus, 679, 684 festo FF, 384, 492, lásd mohó ládapakolási algoritmusmohó algoritmus mohó algoritmus FFD, lásd rendezo Fibonacci-számok, 22 Fickett algoritmusa, 550 FIFO, 480 FIFO sorrend, 410
FIFO- ´ , 473 F-, 469gy Fitch-algoritmus, 554gy xpont módszerek, 321 xpontos számábrázolás, 671 zikai memória, 470
790
Tárgymutató
ipop állapotkapcsoló, 298
grakus megjelenítés, 603
fogoly dilemma, 315
grázomorzmus probléma, 104, 144, 150, 153
fokszám, 104
gravitációs segítség, 583
folyamat, 224, 228 180 folyamatszerkeszto, folyamfüggoség, 284
grid, 689
forgalomirányító protokollok, 170
grid index, 689 Gröbner-bázis, 63, 67, 68, 69, 70, 88, 92fe minimális, 70
forgalomszervezés, 171 forrás, 418 forrásmodellezés, 418
redukált, 69, 70 Gustafson-Barsis-törvény, 229
forrás modellezése, 429 F, 556
GY
Fourier-Motzkin elimináció, 304
gyengén stabil, 742
Fourier-transzformáció, 697 foegyüttható, 44
G- ´ ¨ ¨ , 254 gyors Fourier-transzformáció, 703
fundamentális megoldás, 15
gyorsítás, 228, 233, 266 lineáris, 233
funkcionális-reprezentáció, 683 F- ´ , 451
futamhossz kódolás, 451 192 futási ido, futószalag-elvu feldolgozás, 277
szublineáris, 233 szuperlineáris, 233
G , 260 ¨ ¨ - ´ gyur u, 101
futószalag-regiszter, 277 függoség
egység, 101 egységelem, 101
egyenloséggeneráló, 525
kommutatív, 101
elágazó, 532
nullelem, 101 nullosztó, 101
funkcionális, 503 ekvivalens családok, 508 numerikus, 532 összekapcsolási, 530 sorgeneráló, 525 többértéku, 525 függoségi bázis, 527
F , 528, 534fe ¨ ´ - ´ függoségi vektor, 284 fül, 620 fülvágó algoritmus, 621
H hálózat helyi, 168 nagy kiterjedésu, 168 pont-pont, 167 személyes, 168 üzenetszórásos, 167 hálózatok szimulációja, 164 Hamming-távolság, 141 Hanoi-tornyai, 22gy
G
hányados, 44, 66
Gantt-diagram, 412fe
hardver-algoritmus, 268 hármasítás, 134
gát, 573 Gauss-elimináció, 89 G- , 729 ´ G, 760
harmonikus számok, 24 3-agy, 583
gazdagép, 269, 275
3DDDA algoritmus, 650 3D szakaszrajzoló algoritmus, 650, 683
gazdaságos algoritmus (BF), 492
háromdimenziós párosítás, 134, 135, 136
gazdaságos hatványtípusú algoritmus (EP), 495 algoritmus (BFD), 494 gazdaságos rendezo
3-SAT, 134
generatív tervezés, 602 generátorfüggvény, 22
háromszög, 608 balállású, 676 jobbállású, 676
bináris fák megszámolása, 28
háromszögháló, 618
muveletek, 23
háromszögmátrix
generikus operátor, 272, 286, 292
alsó, 308
gép, 364
hasítás, 151 hasonló párhuzamos gépek, 366
gépi epszilon, 722
hasonlósági transzformáció, 750
genetikus algoritmus, 585, 602
G´ -, 722 Givens-módszer, 754 globális helymeghatározó rendszer, 168 gombócevési sebesség, 489
határfelület, 607 366 határido, határregiszter, 457 H ´ ´ - ¨ ¨ , 253
Gotoh-algoritmus, 542 gömb, 607, 608
hatékony megoldás, 603
görbe, 608
hatékonyság, 229, 233, 266, 277 hatékonysági mérték, 233
GPS, lásd globális helymeghatározó rendszer gráf automorzmus, 104 diszjunkt egyesítés, 104 izomorzmus, 104 gráfautomorzmus probléma, 104
H ´ -, 245
abszolút, 231 relatív, 231 hátizsák probléma, 589 háttérmemória, 470 H , 752, 757gy, 758gy ´ ´
791
Tárgymutató
hatványsor, 42
Internet, 167
házasítás probléma, 135 Heaviside-féle lépcsosfüggvény, 716
internetwork, 167
helyes, 505 helyiértékes számábrázolás, 39
inverz, 101 inverz elem, 101
helyi hálózat, 168
inverz hatványmódszer, 753, 758gy
helyvektor, 606
inverz hiba, 719, 741
helyzetkép, 289
inverz hibaanalízis, 719
henger, 608
inverz mátrix, 99 inverz stabil, 719, 720
Hermite-redukció, 74, 75, 81, 85, 88gy, 92fe heurisztika, 585, 599, 601, 602 585 cserélo,
invariánsok módszere, 673
irányított kapcsolat, 275 irreguláris célfüggvény, 367
heurisztikák, 584
I , 738 ´ ´ - ´
hiba, 717 hibakorlát, 717, 726gy
iterációs vektor, 273 I´- - , 594 ¨ ´
Hilbert-bázis, 67
iteratív javítás, 764fe
Hilbert-mátrix, 744 hiperexponenciális elem, 78
I´-´ ´ , 747
iteratív mélyítés, 586, 601
Hirschberg algoritmusa, 549
izoparametrikus görbe, 609
hisztogram kiegyenlítés, 696 hitelesség, 110 hivatkozási sorozat, 471 HMMER, 577 holtversenyes esetek, 586 homogén koordináta, 639, 640
H , 20 ´ - ´ homogén lineáris transzformáció, 638, 642
J játék folytonos, 320 kevert bovítése, 327 véges, 315 zérussösszegu, 317
Horowitz-módszer, 75 folyamat, 196 hosszú távon függo hosszú távú függoség, 171
játékos, 314 jobbkéz szabály, 606
Householder-módszer, 754 hozzárendelési probléma, 589
jól kondicionált, 719
Huffman-algoritmus, 426
Huffman-kódolás, 418 Hurst-paraméter, 196, 199203
jobbsodrású, 669 JPEG, 419, 447
K k-adik pivotelem, 730 kamera transzformáció, 665
I, Í ideál bázisa, 63 varietása, 63 ideális egyenes, 638 ideális pont, 638 ideális sík, 639
kampus-klaszter, 227 kapacitás, 364
K ´ -, 514, 515áb, 524 kapcsolat, 270, 275 kapcsolat kapacitás, 170 kapcsolatszerkezet, 284 hexagonális, 285
ideállánc, 67, 69
karakterisztikus egyenlet, 15, 749
I-divergencia, 425 idoszelet
kd-fa, 658
karakterisztikus polinom, 749
IEEE, 723
K-- ´ ´ ´ , 659 képernyo-koordinátarendszer, 663 képpont, 638
IEEE Information Theory Society, 454 igény szerint, 470
kerekítés, 722
diszkrét, 274 idovektor, 280
illesztett pár, 540
képszintézis, 605 kerekítési hiba, 722
indexhalmazok transzformációja, 303
keresés, 259 keresési feladat, 259
indexkifejezés, 303 információátviteli intenzitással, 203
kernel, 703
implicit egyenlet, 607
inhomogenitás, 309 inkrementális elv, 662, 670, 674 integrál logaritmikus része, 74 racionális része, 74 integrálás parciális, 73 integrálgeometria, 658, 684 integrállogaritmus, 78 interaktív evolúció, 602 interaktív több feltételes döntéshozatal, 602
keret méret, 171 késés, 170 késleltetés, 230, 275 késleltetett kiértékelés, 42 kétdimenziós párosítás, 134, 135 két fül tétel, 621, 683
K ´ ´ -´ ´ , 464 csere, 599 kettos kezdeti feltétel, 14 állapot, 471 kezdeti vezérlo ki/beviteli séma, 276
kiegyensúlyozás, 744 kielégíthetoség probléma, 133, 134, 139
792 kiemelt klaszter, 227 kifejezések egyszerusítése, 71
Tárgymutató
kulcs, 504, 510, 524 elsodleges, 531
kizetés, 314 kizetofüggvény, 314 kizetomátrix, 317
kulcscsere-probléma, 94
kizetovektor, 314
kúp, 608 pont, 607 külso külvilág, 270, 275
kihasználtság, 293, 295 kimenetfüggvény, 471 kimeneti csatorna, 270 kimeneti normál forma, 304 jelek halmaza, 471 kimeno
K- , 511 kulcs tér, 96
kvantálás, 449, 450 kvantikálás, 273
kiszámítható függvény, 129 kiterjedés, 430
L
kiválasztás, 259 kiválasztó rendezés, 308
ládapakolási probléma, 384
kivonatok, 583, 584
lapcserélési algoritmus
klasszikus Cournot-modell, 349
statikus, 471 lapcserélési algoritmusok, 470480
K´ ¨ , 557
K-E, 44, 92 K-E algoritmus muködése, 45áb klasszikus hibaszámítás, 717 klaszter, 224, 227 algoritmus, 584 klaszterezo k-legjobb algoritmus, 581
LAN, lásd hálózat
laphiba, 472 lapkeret, 470 Laplace-szurés, 708, 709áb, 804áb lapozási sebesség, 481 lappont, 625 lassú indulás algoritmus, 172
Knudsen-Hein-nyelvtan, 559gy
láthatósági feladat, 675
Kologorov-bonylultság, 440
Laurent-sor, 85 LazardRiobooTrager-formula, 76 lebegopontos aritmetika, 721, 722, 724, 764fe lebegopontos aritmetikai szabvány, 725
K ´ , 725 ´ - ¨ komplementer feladat, 356 kompozíció, 102, 539 komputeralgebra, 38
komputeralgebra-rendszerek általános célú, 90 speciális célú, 90 kondíciószám, 718, 719, 726gy, 740, 748gy, 763fe, 765fe konjunktív normálforma, 134 konkáv csúcs, 620 függvény, 543 konkáv résbünteto konstansok részteste, 73
lebegopontos számhalmaz, 726gy 377 leghosszabb megmunkálási ido, legjobbválasz, 321 legkevesebb megmaradt megmunkálás, 410 385 legkisebb megmunkálási ido, sorrendje, 373 legkorábbi határidok legközelebbi szomszéd keresés, 715fe L- ´ , 458, 469gy
L-- ´ -´ , 460, ´ ´ - ´ 469gy
konstansok variálásának módszere, 21
legrövidebb kör, 582
konstruktív tömörtest geometria, 616
legrövidebb megmaradt megmunkálási idok, 376 368 legrövidebb megmunkálási ido,
konvex burok, 611 konvex csúcs, 620 konvex-kombináció, 608, 609
K ´ ´ , 700, 704, 710gy, 715
legrövidebb út probléma, 582, 589, 595 lehetséges megoldások, 581, 582, 584 Leibniz-szabály, 73
konvolúció kiterjesztése, 715fe
lényegtelen transzformáció, 448
koordináta, 606 K --, 469gy ´
lépésszám
K --, 470gy ´
átlagos, 232 legjobb esetben, 232
költségvezérelt módszer, 658
legrosszabb esetben, 232
körmentes gráf, 266 környezetfa, 436 K¨ -- ´ ´ ´ , 438 környezetfa súlyozó algoritmus, 437 közönséges pont, 638 köztes számítási tárrobbanás, 42 Kraft-egyenlotlenség, 418, 422 KrichevskyTromov-becslés, 435 kriptoanalízis, 95 kriptográa, 94124
várható, 232 LERC, 154 leszámlálás, 316 L ´ ´ , 506, 507, 524, 533gy attribútumhalmazé, 505, 506, 511gy funkcionális függoségé, 504, 506, 511gy LF, 491
LFU- ´ , 476 LIFO sorrend, 410
L - ´ ´ , 34
kriptológia, 95
L - ´ ´ ´ , 508, 518, 519, 522
kriptorendszer, 96
lineáris programozás, 595
aszimmetrikus, 96, 99 monoalfabetikus, 97 nyilvános kulcsú, 110 polialfabetikus, 97 szimmetrikus, 96, 99 Kruskal-algoritmus, 266fe KuhnTucker-feltételek, 324
LINPACK, 746 Liouville-elv, 79, 80, 82, 83, 86 listarövidítés, 496 listás ütemezés, 382 logaritmikus bovítés, 73, 83 derivált, 73, 78
793
Tárgymutató
elem, 78, 81 függvények, 80
háromszög, 647 sík, 647
L- ´ - ´ , 77
M ´ - ´ ´ ´, 634
logikai következmény, 504, 525 log-odds, 546
MF algoritmus, 387, 388 MF ládapakolási algoritmus, 386
L- ´ ¨ ¨ , 251
M-G, 156
LogP, 242, 243
MIB, lásd Menedzsment információs adatbázisból
lokális keresés, 601 cserével, 585, 599, 600 kettos L - , 585 ´ ´ -- ´ - ¨ ¨ - ´ ´
Mieses-eljárás, 753
lokális optimum megtalálása, 585 lokális vezérelhetoség, 614
MIMD, 224
mikro mutációk, 587 M-R, 112
LPT, lásd leghosszabb megmunkálási ido
M - ´ ´ , 509, 523, 533fe minimális törzsfejlodés, 538
LPT sorrend, 378, 385, 410, 412 LRU- ´ , 474
minimális változtatás, 581 mintavételezés, 710
LU-felbontás, 732
mintavételi tétel, 712
LU- , 733 ´
LU-módszer-pointeres-technikával, 734
MISD, 224 modell
LWR, lásd legkevesebb megmaradt megmunkálás lyuk, 470
determinisztikus, 165 dinamikus, 165
lyukszurés, 706
diszkrét, 165 uid-ow, 197
M
folytonos, 165 kötegelt markovi érkezés, 197
M-A, 156
markovi érkezési folyamat, 197
MA az ArthurMerlin hierarchiában, 117
Markov-modulált Poisson-folyamat, 197
MAN, lásd hálózat
statikus, 165
maradék, 44, 66 Markov-modell, 575fe
sztochasztikus, 165 modellfejlesztési életciklus, 189
masírozó kockák algoritmus, 626
M - ´ , 108 ´ ´
másodrendu felületek, 646 rendszer, 91 matematikai szakértoi
M --´, 60 ´ M --´, 60 ´
MATLAB, 724, 762 mátrix
moduláris számábrázolás, 39 M ´ , 386
adjungált, 99
mohó algoritmus (FF), 492
determináns, 99
mohó ládapakolási eljárás, 384 molekuláris óra, 566
inverz, 99 sur u, 310 mátrix és vektor szorzása, 307
monom, 64 monomiális
mátrix invertálás, 734
elem, 80 ideál, 67
mátrixjáték, 332 Matrix Laboratory, lásd MATLAB mátrixszorzás, 269, 270, 272, 278 M , 760 ´ ´ -- ´
M ´ ´ -, 761 M , 761 ´ ´ --´ ´ M ´ ´ - ¨ -, 761
rendezés, 64 Monte-Carlo-algoritmus, 112 Monte Carlo integráció, 601 MPI, 222 MPI-2, 238 MPMD, 228, lásd többszörös program többszörös
maximális adatátviteli egység, 171
adat
MBR, lásd befoglaló négyszög
MTU, lásd maximális adatátviteli egység
Mealy-automata, 471 M ´ , 566 706, 707áb medián szur o,
multifelbontás, 737 multifelbontás algoritmus, 738
megengedett akciók halmaza, 314
munkadarab, 364
megengedett megoldás, 581, 588
munkahatékony, 234
megengedett részhalmaz, 588 365 megmunkálási ido,
munkahatékony algoritmus, 233 mutatóugrás, 249
M , 518
munka, 233, 266
muvelet, 364
megszakítás, 366
MWKR sorrend, 410
mellékosztály
MWR, lásd leghosszabb megmaradt megmunkálás
jobb oldali, 103 mélység-puffer, 675 memória, 275
N
memória elaprózódása, 465
N-BCNF, 522
Menedzsment információs adatbázisból, 190 mérnöki visszafejtés, 683 meroleges
Nash-egyensúly, 314 nccNUMA, 224
vektorok, 606
nccNUMA architektúra, 226 négycsúcs metrika, 566
mesterszál, 239
négyes fa, 657gy
metszéspont számítás
négy-fa, 690, 692áb, 694gy, 715fe
794
Tárgymutató
N´ --, 692
oszd-meg-és-uralkodj algoritmus, 590
négyszögimpulzus, 698
osztó, 309
négyzetes egyenletrendszer, 727 négyzetes szita, 115 blokk Jacobi-multifelbontás, 738 nemátfedo nemdeterminisztikus idobonyolultság, 130 nemdeterminisztikus Turing-gép, 127 nem-gát, 573 nemlineáris komplementer feladat, 357 Neumann-módszer, 338 N-, 466, 469gy
NF, 492, lásd egyszeru algoritmus egyszeru NFD, lásd rendezo algoritmus Noether-gyur u, 67 NORMA, 224, 226
Ö, O ökölszabály, 741 önhasonló folyamat, 196 önhasonlóság, 195 ön-visszavezethetoség, 147 összeadó, 270 összeg típusú optimalizálási probléma, 588 összegzofüggvény, 322 összekapcsolás, 293 összetett muvelet, 274
normálalak, 44 normálforma, 519 BCNF, 519, 520, 533fe BoyceCodd, 519, 520 3NF, 519, 520 3NF, 519, 520, 534fe 4NF, 519, 528 negyedik, 519, 528 5NF, 531 ötödik, 531
P pálya, 103 PAM, 543, 546 PAML, 577 PAN, lásd hálózat paraméteres egyenlet, 608
P´ - - ´ ´ ¨ ¨ , 251 P´ - -, 264 ´
normalizált, 721
parciális törtekre bontás, 81 párhuzamos
NP-teljes, 584 NP-teljes probléma, 582
párhuzamos: egyenes, 609
NP-teljesség, 133
párhuzamos algoritmus, 738
N-P-I, 146
NRU- ´ ´, 477 NRU-, 478
NRU- ´ , 477 nulla-egy elv, 252 nullosztó, 101 numerikusan instabil, 719, 726gy numerikusan stabil, 719, 727gy numerikus instabilitások, 603 NURBS, 615
NY nyeregpont, 317 nyílt szöveg, 96 nyilvános kulcs, 96 nyilvános kulcsú kriptográa, 95 nyilvános kulcsú kriptorendszer, 95 nyolc-fa, 694
vektor, 606 párhuzamos: sík, 608 párhuzamos vektorok, 606 páronkénti összeg, 551 páronkénti összehasonlítás, 496 párosítás, 134 párosító algoritmus, 493 páros rejtett Markov-modell, 559 partíció, 456 dinamikus, 463 rögzített, 457 partikuláris megoldás, 14 pászta, 673 Peano rendezés, 694 példány, 503 peremcella, 270 periódus, 97, 301 permanens virtuális áramkör, 191 permutáció, 102 identikus, 103 permutációcsoport, 102 permutációcsoportok, 102
O, Ó
permutációmátrix, 733
oktális fa, 656 Oktatási Minisztérium, 4
PF, 493, lásd párosító algoritmus párosító algoritmus PFD, lásd rendezo
oligopol játék, 349
PFF, 479
on-line ütemezési feladat, 367 OpenMP, 222, 241
PFold, 577
OPNET, 221, lásd Optimalizált hálózattervezo
pivotelemek növekedési tényezoje, 731
optikai szálas elosztott adatinterfész, 168 eszközök, 178 Optimalizált hálózattervezo
pixel, 605 Poisson-pontfolyamat, 653
optimumszámítási feladat, 326 OPT-, 475
poliéder, 619
OPT- ´ , 474 orákulum, 145
orákulumos Turing-gép, 145 origó, 606 ortogonális, 754 ortonormált bázis, 754
O--´ --, 591
pillangó felosztás, 626, 683
poligon, 619
P ¨ ´ , 675 algoritmus, 673 poligonkitölto polinom ábrázolása, 41 összetevoje, 50 primitív, 50 többváltozós, 41, 65
795
Tárgymutató
polinom diszkriminánsa, 63gy
raszteres adatmodell, 686
polinomegyenletek
raszterizáció, 670
ekvivalenciája, 70
Rayleigh-hányados, 752
megoldáshalmaza végessége, 71 megoldhatósága, 71
redundancia, 439 regiszter, 270, 285
véges megoldásai száma, 71
P -BCNF, 523 ´ polinomiális ido-hierarchia, 145, 149 P- ´ - ´ egyhatározatlanú, 45, 63 többhatározatlanú, 66 politóp, 281 pont, 606
R´ ´ ----´ , 462, 469gy ´ - ´ reguláris célfüggvény, 367 rejtett Markov-folyamat, 555 rejtett Markov-modell, 577 rejtett szöveg, 96 rejtjelezo 99 blokkrejtjelezo, affin, 99
pontos, de lassú eljárások, 584 P-- ´ , 433 ´
lineáris, 99 eltolásos, 96
pontos bonyolultság, 234 pont-tartomány négy-fa, 690
helyettesítéses, 99 99 Hill-rejtjelezo,
PRAM, 242
monoalfabetikus, 99
prex kód, 421 prex kód redundanciája, 429gy
permutációs, 99 polialfabetikus, 99
prexszámítás, 244 prekondicionálás, 745
P, 264 Prim-algoritmus, 266fe
transzpozíciós, 99
R´, 36
rekurzív egyenlet, 14, 273 állandó együtthatós lineáris, 15
prím attributum feladat, 534fe
homogén lineáris, 15, 20
51áb P´-E algoritmus muködése,
inhomogén lineáris, 20, 32, 33 lineáris, 15, 20, 26, 32
P´-E, 51, 92gy primitív gyök, 107 probléma
DiffieHellman-probléma, 109
probléma érzékenysége, 739 program, 399
megoldása generátorfüggvénnyel, 26 rekurzív egyenletek, 13 rekurzív felbontás, 690, 691áb R´- ´ , 724 ¨ relációs séma, 503
Projector, 577 projekció, 280
relatív hiba, 726gy, 765fe
projekció iránya, 280, 291
relatív inverz hiba, 747
projekciós mátrix, 280
relativizálható bonyolultsági osztály, 145 relatív lépésszám, lásd gyorsítás 369 rendelkezésre állási ido,
projekciós vektor, 280 projektív egyenes, 641 projektív geometria, 638 projektív sík, 639, 641 projektív szakasz, 641 projektív tér, 638, 639 180 Projektszerkeszto, protokoll zéró-ismeretu, 118
relatív hibakorlát, 717, 722, 726gy, 748gy
rendezés, 262265, 307 megengedett, 64 monomiális, 64, 71gy rendezett fa, 562 egyszeru rendezo algoritmus (NFD), 494 gyors algoritmus (QFD), 494 rendezo
protokoll többletterhelés, 171
reprezentánsrendszer jobb oldali, 103
pszeudo-hányados, 50
rés, 541
pszeudo-maradék, 50 366 puha határido,
résbüntetés, 541
PVC, lásd permanens virtuális áramkör
részcsoport, 101 részleges foelemkiválasztás, 730 részstring, 546 reziduális hiba, 739
Q gyors algoritmus QFD, 494, lásd rendezo
reziduum-tétel, 34
QR-módszer, 758gy QR- , 756 ´
Sylvester-féle alak, 54 rezultánsmódszer, 52
QSM, 242
R-fa, 716
rezultáns, 52, 82, 85
RGB színmodell, 695 Risch-algoritmus, 77, 79, 81, 88 R
R/S, lásd Újraskálázott Módosított Tartomány
exponenciális eset, 84 logaritmikus eset, 81
racionális függvények integrálása, 72 racionális számok, 41
Risch-differenciálegyenlet, 87
rács, 224 rács paraméterei, 271
RNS-térszerkezet, 584 Rodrigues-képlet, 643, 644gy
raktározás, 364
rossz megosztás, 225
R-SAT, 142 R- ´ ´, 462 706 rangszur o,
RMON, lásd Távoli meggyelo
RothsteinTrager-módszer, 76, 82, 85 rögzített partíciók, 457 folyamat, 196 rövid távon függo
796 S
Tárgymutató
SZ
sajátérték, 749, 765fe sajátérték kondíciószáma, 751
S - ´ ´ - ´ ´ ´ , 650
S - -, 651 ´ ´ - ¨
sajátvektor, 749 sakk, 583, 601
S - ´ ´ - ´ -, 650, 651 szakasz, 609
SAT, 134
szakasz egyenlete, 609
sávmátrix, 735, 736
szál, 228
S -LU- ´ ´ ´ , 736
S -C- ´ ´ ´ , 737 S - ´ -, ´ ´ - ´ ¨ ´ 736
S - ´ -, ´ - ´ ¨ ´ 736
szalagmátrix, 310 szállítás, 364 szálprogramozás, 235, 241 számítási modell, 232 számítási tárrobbanás, 70 számítógépes biológia, 584
sávszélesség, 170, 230, 310 706 sávszur o,
szekvencia, 538
S, 759
személyazonosítás, 117 szempozíció, 663
semleges elem, 101
szerencsés prím, 60
ShannonFano-algoritmus, 426
szétdarabolás, 276
ShannonFanoElias-kód, 426 sík, 607
szétvágás o, 517 függoség orz o 3NF-re, 523 függoség orz
SIMD, 224 SISD, 224 skaláris szorzat, 605 skalárszorzat, 272 skálázás, 744
veszteségmentesen BCNF-be, 521 veszteségmentes összekapcsolású, 512 szimbolikus integrálás, 71
Skeel-féle norma, 742
számítások, 38
SL, lásd listarövidítés
szimbolikus meghatározás, 281
SMP, 224 Sniffer, 188
szimmetrikus mátrixjáték, 334 szimulált hokezelés, 585
SNMP, lásd egyszeru hálózati menedzsment
szimultán stratégiavektor, 314
protokoll
SNR, lásd jel/zaj hányados sokszög, 619 sorba fejtés, 272 sorozat, 364, 366
színesség, 448 szinkron munkamód, 274 szisztolika, 268 szisztolikus, 268 szisztolikus algoritmus, 269
sorozat csoportosítási probléma, 589 sörétes-puska nukleinsavleolvasás, 574
egyenletes, 278 szisztolikus rács, 268, 269, 310
SP, lásd egyszeru hatvány algoritmus spektrum, 697
elfajult, 307 hexagonális, 279, 282 lineáris, 308áb
SPMD, 228, lásd egyszeres program többszörös adat S-polinom, 68 Spouge algoritmusa, 550 SPT, 375, 376, 379, 380, 410, 412fe, 414, lásd |textitlegrövidebb legrövidebb megmunkálási ido megmunkálási ido SRPT, lásd legrövidebb megmaradt megmunkálási ido
téglalap alakú, 269áb többdimenziós, 277 szisztolikus rács pereme, 306 szisztolikus rendszer, 268311, 269 szorzás-összeadás, 274 szorzó, 270 sztochasztikus automata, 141
stabilizátor, 103
szublineáris gyorsítás, 233 szubnormális szám, 725, 727gy
stabilizátor lánc, 103
szuperkulcs, 504, 510
stacionárius, 286
szuperlépés, 242
stacionárius számítás, 277 stacionárius változók, 277, 293, 296
szuperlineáris gyorsítás, 233
stratégia, 314 stratégiahalmaz, 314
T
sugár, 645
támadás
S ´ - - ´ , 646 S , 660 ´ - - ´ -- ´
S - , 656 ´ - - ´ - ´ ´
S - , 651 ´ - - ´ - ´ ´
aktív, 109 faktorizálási, 114 középen állás támadás, 109 nyílt szövegu, 100
sugárkövetés, 645
passzív, 109
sugárparaméter, 645 súlyfüggvény, 539
rejtett szövegu, 97, 100 kulcs, 100 rejtjelezo
súlyozott eloszlás, 437
választott szövegu, 100, 114
súlyozott legrövidebb megmunkálási idok, 375
tanácsadó rendszerek, 583
SutherlandHodgeman-poligonvágás, 634, 683 SWPT, lásd súlyozott legrövidebb megmunkálási sorrendje idok
tárgypont, 638
SWPT sorrend, 380
tartomány kalkulus, 515
797
Tárgymutató
tartomány négy-fa, 693
UDC, lásd egyértelmuen dekódolható kód
taszk, 224, 228
Ukkonen algoritmusa, 550 és alsó becslések ULE, lásd felso
taszkpárhuzamosság, 228 190 Távoli meggyelo, T csomópont, 623
ultrametrika, 564 unimoduláris mátrix, 281, 282
technológiai útvonal, 365
univerzális hasítás, 151
téglatest, 607 teljes foelemkiválasztás, 730
utazóügynök probléma, 589
teljesítmény, 301 teljesítménymérték, 169
útvonal keresése, 581 586, 587, 592 útvonaltervezo,
275, 283 teljes végrehajtási ido, 366 tényleges határido,
Ü, U
T- , 565 ´
tér, 605 térbeli frekvencia, 695 térbeli indexelés, 687 térbeli koordináták, 271, 281 térbeli középvonal módszer, 658 tér-ido-leképezés, 278, 279, 280, 303 térinformatika, termelési feladat, 365 természetes összekapcsolás, 512, 522 test, 101, 102, 607 test középvonal módszer, 658 tesszeláció adaptív, 622 tesszelláció, 618 tetszoleges futási ideju algoritmusok, 586, 601 tevékenység, 364 TIAT, lásd tranzakció érkezési idoköz titkos kulcs, 96 tórusz, 607 többutas ütemezési probléma, 366, 397 több választási lehetoséges optimalizálás, 580, 581 több választási lehetoséges teszt, 581 több választási lehetoséget adó algoritmus, 581 több választási lehetoséget kínáló rendszer, 580, 586 több választást kínáló rendszer, 581 példa, 582 többváltozós polinom 65 fomonomja, fotagja, 65 multifoka, 65 tagjai, 65 tökéletes titkosság, 100 tömb feje, 248 tömbrangsorolás, 247 tömörítés veszteséges, 419 veszteségmentes, 419 töröttvonal, 618 transzcendens elem, 78, 81 elemi függvénytest, 78 elemi kiterjesztés, 78 transzformáció, 638 transzformáció-kiterjesztés-minta modell, 197 tranzakció érkezési idoköz, 199 tranziens függvény, 698 tri-lineáris közelítés, 626 túlcsordulás, 763fe
utazóügynök probléma (TSP), 582, 584, 599, 603
ütközésfelismerés, 628, 645 üzenet, 96
V vágás, 628, 633, 663, 668 szakaszok, 633 170 válaszido, választás, 437 választott szövegu támadás, 123 valós ideju problémák, 581 váltási hely, 234 változó intenzitásirányítás, 203 VBR, lásd változó intenzitásirányítás véges játék, 315 döntés, 580, 583 végso vektor, 605 abszolút értéke, 605 összeadás, 605 skaláris szorzás, 605 számmal szorzás, 605 vektoriális szorzás, 606 vektorizáció, 618 vektoros adatmodell, 686 véletlen séta, 141 veremtulajdonság, 490 veszteséges tömörítés, 419 veszteségmentes tömörítés, 419 vezérfa, 547 vezérlés globális, 296 helyi, 296 vezérlés, osztott, 300 állapotok halmaza, 471 vezérlo vezérlopont-sorozat, 610 viewport, 687 Vigenère-négyzet, 97 virtuális lap indexe, 471 virtuális memória, 470 virtuális világ, 605 visszaállítás, 296áb visszafelé indukció, 318 V´ ´ , 728 visszalépés, 139, 140 visszavezethetoség, 133, 139gy Viterbi-algoritmus, 557 voxel, 626
Turing-gép, 126, 127áb, 145 Turing-gép szemantikája, 128 Turing-gép szintaxisa, 127 Turing-visszavezethetoség, 145, 148
W WAN, lásd hálózat
W-, 679 W-, 469gy, 470gy WS, 479
U, Ú
WS-, 479
798 Y
Tárgymutató
z-buffer, 675
YCbCr-transzformáció, 447
z-buffer algoritmus, 675
Z
Z-- ´ - ´ ¨ , 678 zéró-ismeretu protokoll, 119
zajmentes kódolás tétele, 422
ZivLempel tömörítés, 440
zártság, 101
Z-transzformáció, 32
Z--, 676
Színes ábrák és ismertet®k
Ebben a fejezetben a kötet legfontosabb színes ábráit és a hazai informatikai bemutató anyagokat gyujtöttük felsooktatás foszerepl oit össze. Eloször a fekete-fehér alapszínu egyetemi ismertetok (Babe¸ s-Bolyai Tudományegyetem, Budapesti Muszaki és Gazdaságtudományi Egyetem, (Debreceni Pécsi Tudományegyetem), azután a színes egyetemi ismertetok Egyetem, Eötvös Loránd Tudományegyetem, Eszterházy Károly Foiskola és Szegedi Tudományegyetem) következnek. Ezután az 5. fejezet (Hálózatok szimulációja) fejezet hat, azután a 6. fejezet (Párhuzamos számítások) egy, majd a 16. (Graka) fejezet négy és végül a 17. fejezet (Térinformatika) nyolc színes ábráját mutatjuk be abban a sorrendben, ahogyan a könyvben elofordulnak.
800
Színes ábrák és ismertetok
BABES-BOLYAI ¸ TUDOMÁNYEGYETEM MATEMATIKAI ÉS INFORMATIKAI KAR RO 400084 Cluj-Napoca, Str. Kogalniceanu 1 Tel: +40-264-405327, Fax: +40-264-591906, Email:
[email protected]; Honlap: http://www.cs.ubbcluj.ro BBBE MATEMATIKAI ÉS INFORMATIKAI KARA A kolozsvári BBBE Matematikai és Informatikai Karán a következo szakokon folyik alapképzés: matematika (román és magyar nyelven), informatika (román, magyar és angol nyelven), matematika-informatika (román, magyar és német nyelven), valamint alkalmazott matematika (román nyelven). A magyar tagozaton évente mintegy 80100 hallgató kezdi el tanulmányait (matematika szakon 1015, informatika szakon 4050, 70 körüli az államilag támomatematika-informatika szakon 30-40). Ebbol gatott helyek száma. Azok a hallgatók, akik elvégzik a pedagógiai modult is, tanári diplomát is szerezhetnek. A magyar tagozaton a hallgatók minden tárgyat tanulhatnak magyarul, de a választható tárgyak esetében (amelyek az egyes tagozatokon különbözhetnek) választhatnak más nyelvu tárgyakat is. A karon mesterképzés (MSc) is folyik román, magyar és angol nyelven. bevezetMagyar nyelven számítógépes matematika szak létezik. 2005-tol 3+2-es rendszert, azaz a 3 éves jük a bolognai egyezménynek megfelelo alapképzést és a 2 éves mesterképzést. Jelenleg az alapképzés 4 év, a mesterképzés pedig további 1 év. A magyar tagozat oktatói igyekeznek magyar nyelvu szakkönyveket is beszerezni a kari könyvtár számára. Így sikerült néhány példányt szerezni az Algoritmusok (Muszaki Könyvkiadó, 1997), az Osztott algoritmusok (Kiskapu Kiadó, 2002), a Párhuzamos algoritmusok (ELTE Eötvös Kiadó, 2003) is. és az Új algoritmusok (Scolar Kiadó, 2003) címu tankönyvekbol Az Informatikai algoritmusok címu tankönyvet az informatikus alap tárgyaihoz fogjuk használni: Algoritmika, Programozás, képzés következo Adatszerkezetek, Algoritmusok elemzése és bonyolultsága, Numerikus módszerek, Operációkutatás, Számítógép-architektúrák, Operációs rendszerek, Mesterséges intelligencia, Az adatbázisok alapjai és Számítógépes graka. Kolozsvár, 2004. augusztus 18. Dr. Kása Zoltán egyetemi tanár dékánhelyettes
801
Színes ábrák és ismertetok
BUDAPESTI MUSZAKI EGYETEM VILLAMOSMÉRNÖKI ÉS INFORMATIKAI KAR 1117 Budapest, Magyar Tudósok krt. 2. Tel: 463-1501, Fax: 463-3580, Email:
[email protected] BME VILLAMOSMÉRNÖKI ÉS INFORMATIKAI KARA A BME Villamosmérnöki és Informatikai Kar alaptevékenységének doktori meghatározó eleme az egyetemi mérnökképzés és az erre épülo (PhD) képzés villamosmérnöki és muszaki informatika szakon. A mérnökképzésben évfolyamonként közel 500 villamosmérnöki, és nagyjából ugyanennyi informatikus hallgató vesz részt. A két egyetemi szintu szak oktatására elméleti alapképzés, a mély szakmai ismereteket adó szakképzés, a az eros széles területen gyakorlati tudást nyújtó laboratóriumi oktatás, és az önálló A szakképfeladatok megoldására irányuló mérnöki gyakorlat a jellemzo. zés során a villamosmérnöki hallgatók a beágyazott információs rendszerek, a híradástechnika, a távközlés és telematika, a számítógép technika, az irányítástechnika, a robotinformatika, valamint az elektronika és energetika területeinek valamelyikében mélyedhetnek el. Az informatikus hallgatók választható moduljai a rendszer- és szoftverfejlesztés, az infokommunikáció, a médiainformatika, az intelligens autonóm rendszerek és a gazdasági informatika. A villamosmérnöki és informatikai szakterület doktori képzésében a hall nemzetközileg is elismert tudományos iskoláihoz kapcsogatók a kar eros, lódva alapkutatással és alkalmazott kutatással foglalkoznak, de emellett szervezett szakmai kurzusokon folytatják tanulmányaikat és részt vállalnak a kar oktatási tevékenységében is. Az Informatikai algoritmusok címu tankönyv többek között az informatika szaknak a Bevezetés a számításelméletbe, Formális nyelvek, Algoritmusok elmélete, Adatbázisok, Operációs rendszerek, Számítógépes graka és képfeldolgozás, valamint Kódelmélet tárgyaihoz, a villamosmérnöki szaknak pedig az Informatika, Számítástudomány alapjai, Számítógépes graka és animáció nevu tárgyaihoz használható jegyzetként, illetve hasznos olvasmányként. kiegészíto Budapest, 2004. augusztus 16. Dr. ARATÓ PÉTER egyetemi tanár dékán
802
Színes ábrák és ismertetok
PÉCSI TUDOMÁNYEGYETEM TERMÉSZETTUDOMÁNYI KAR, MATEMATIKAI ÉS INFORMATIKAI INTÉZET H-7624 Pécs, Ifjúság útja 6.
Telefon/Fax:
+36 (72) 503-615,
E-mail:
[email protected]
PÉCSI TUDOMÁNYEGYETEM MATEMATIKAI ÉS INFORMATIKAI INTÉZETE
A PTE Természettudományi Karán hosszabb ideje folyik számítástechnika szakos tanárképzés, elsosorban a technika, illetve matematika tanárszakkal együtt szakpárban. Az fejlesztéseinek eredményeként önálló informatikus szak indítására keelmúlt évek jelentos rült sor a 2003/2004 tanévben, ekkor indult el a TTK-n a programozó matematikus szak évfolyama. Ezeknek a szakoknak a gazdája a Matematikai és Informatikai Intézet, elso amely ugyanakkor ellátja a Karon az informatika ismeretanyagának oktatását közismereti tantárgyként, illetve szaktárgyként a többi természettudományi szakos hallgatók számára. Ebben az évben két új informatika orientált szak akkreditálására került sor a kezdve elindul a képzés a zikus inforTermészettudományi Karon a 2004/2005 tanévtol az informatika matikus és könyvtáros informatikus szakokon. A két szak közül az elso komoly elméleti alapozását is megköveteli. informatikus alapképzési szak akkreditációs anyagának Jelenleg a programtervezo benyújtása ez év szeptemelkészítése van folyamatban, s az akkreditációs eljárásra történo berében fog megtörténni. A szak indítása a 2005/2006 tanévben várható. Az Informatikai algoritmusok címu könyvet (hasonlóan az Új algoritmusok címu és informatikus alapképmás korábban elkészült könyvekhez) elsosorban a programtervezo zési szakon fogjuk használni tankönyvként. Várhatóan fontos segítséget fog jelenteni több tantárgy oktatásában: Számításelmélet, Operációkutatás, Adatbázisok elméleti alapjai, Számítógépes graka, Numerikus módszerek. A könyv számos fejezete hasznos oktatási anyagot képez a TTK-n jelenleg folyó matematika tanár és az ebben az évben induló zikus informatikus képzéshez, továbbá a PTE más informatikai irányú képzéseihez is.
Pécs, 2004. július 15. Dr. Szeidl László egyetemi tanár igazgató
803
Színes ábrák és ismertetok
DEBRECENI EGYETEM INFORMATIKAI KAR 4010 Debrecen, Pf. 12. E-mail:
[email protected] Telefon: (52) 489-100, Fax: (52) 416-857
DEBRECENI EGYETEM INFORMATIKAI KARA A Debreceni Egyetem Informatikai Kara a Kelet-Magyarországi régióban az egyetlen akkreditált egyetemi szintu informatikai szakemberképzés gazdája. A kar öt tanszékén (Alkalmazott Matematika és Valószínuség-számítás, Információ Technológia, Komputergraka és Könyvtárinformatikai, Szá mítógépes Rendszerek és Hálózatok, Számítógéptudomány) dolgozó 6 professzor, 13 docens (fomun katárs), 21 adjunktus (tudományos munkatárs), 14 tanársegéd és 21 felsofokú végzettségu számítás technikai munkatárs jelentos, nemzetközileg is jegyzett szellemi potenciált képvisel. A Informatikai Karon jelenleg
• • • • •
informatikus (nappali, 6 félév, alapképzési BSc szint); programtervezo programozó matematikus (esti, 8 félév, foiskolai szint); matematikus (nappali, 10 félév, egyetemi szint); programtervezo 10/6 félév, egyetemi szint); informatikatanár (nappali, levelezo, 10/6 félév, egyetemi szint) informatikus könyvtáros (nappali, levelezo,
szakokon folyik képzés. informatikus, programozó- és programtervezo matematikus szakokon olyan komplex szakA programtervezo szakemberek képzése a cél, akik képesek a mindennapi élet által felvetett mai elméleti ismeretekkel rendelkezo megoldási módszerek megkeresésére, illetve gyakorlati problémák tudományos igényu modellezésére, a megfelelo kidolgozására, képesek ilyen feladatok elvégzésére szervezodött csoportok szakmai irányítására, rendelkeznek a elméleti-, módszertani- és nyelvismeretekkel. A progszakterületükön folytatható kutatásokhoz szükséges alapveto informatikus alapképzési BSc szakon a képzés Magyarországon eloször ramtervezo 2004-ben a Kar gondozásában indult. Ennek, az ún. Bolognai folyamatnak a keretében folyó képzésnek fontos szerepe lesz abban, hogy hazánk az Európai Unió tagjaként szervezetileg is felzárkózzék az európai felsooktatási térséghez. A szakindítás az infor matikai képzés kínálatában elsosorban nem mennyiségi, hanem minoségi változást eredményez:
•
A nemzetközi mércéhez alkalmazkodó képzési rendszer és végzettség jelentosen növeli végzett hallgatóink bekapcsolódásra. esélyeit a nemzetközi munkamegosztásba történo
•
A mesterképzés (MSc) bevezetése után világos helyzetet teremt a továbbtanulásnál.
A Kar által gondozott tanárszakokon a cél olyan magas szintu informatikai, illetve pedagógiai és általános mu tanárok képzése, akik szakirányú és pedagógiai ismereteik alapján képesek az informatika veltséggel rendelkezo tanár képes lesz a hazai tanítás értékes hagyományainak tanítás minden szintjén feladatok ellátására. A leendo és színvonalának megorzésére, a képzésben fontos szerepet játszik továbbá a kitekintés e szakterület oktatásának európai hagyományaira is. Informatikus könyvtáros szakon olyan felsofokú szakemberek képzése a cél, akik tanulmányaik során elsajátították a könyvtár- és tájékoztatástudomány korszeru elméleti alapismereteit, továbbá az önálló gyakorlati alkalmazásukhoz szükséges ismereteket, beleértve az információkezelést, illetve az erre vonatkozó kutatások módszertanát is. jelenleg 1700. Ezonfelül teljes egészében az InforA Kar saját szakjain oktatott hallgatók létszáma jelentos, matikai Kar gondozza más karok, így a Közgazdaságtudományi, Jogi, Muszaki Foiskolai Kar informatikai kurzu szerepet játszanak a hat programmal muköd Matematika és Számítástudományok sait is. Munkatársaink jelentos o hallgatót beiskolázva. doktori (PhD) iskolában is évi 810 nappali és 1020 levelezo A Kar kiterjedt nemzetközi kapcsolati lehetové teszik, hogy évente több tucat hallgatónk vegyen részt külföldi részképzésben Európa és a világ jó nevu felsooktatási intézményeiben. hazai szakmai együttmuködésének Munkatársaink gyümölcsözo egy szép példája az Informatikai algoritmusok címu könyv elkészítése is, amelyet minden bizonnyal Debrecenben is haszonnal tanulmányoznak majd az érintettek. A Debreceni Egyetem klasszikus értelemben vett egyetem. 18 karán és kari jogállású intézetében nemcsak elszigetelt szakemberképzés folyik, hanem a szakterületek együttmuködésén, a sokszínuség kihasználásán kulturális életével, szabadidos kínálatával ebben méltó partnere az egyetemnek alapuló értelmiségképzés. Pezsgo Debrecen városa is. Debrecen, 2004. augusztus. 16. Dr. Fazekas Gábor mb. dékánhelyettes
804
Színes ábrák és ismertetok
EÖTVÖS LORÁND TUDOMÁNYEGYETEM INFORMATIKAI KAR
1117 Budapest, Pázmány Péter sétány I/C. Tel: 381-2139, 381-2222 Fax: 381-2140
mateAz ELTE Informatikai Karán jelenleg a nappali tagozaton programtervezo matikus (a 2003/2004-es tanévben 1847 államilag nanszírozott hallgató), informatikatanár (190 hallgató) és térképész (96 hallgató) egyetemi szakon folyik képzés. Ugyanebben a tanévben az esti tagozaton programozó matematikus foiskolai alapsza kon (332 hallgató), számítástechnika-tanár foiskolai alapszakon (57 hallgató) és levelezo tagozaton (228 hallgató) is tanultak hallgatók. Az Informatikai Doktori Iskolának 23 államilag támogatott hallgatója volt. informatikus alapszak A Kari és az Egyetemi Tanács jóváhagyta a programtervezo (BSc) akkreditációs pályázatát. A szak indításának tervezett idopontja a 2005/2006-os tanév. A Kar legfontosabb rendszeres rendezvényei az Ipari Nap (a 2003/2004-es tanévben az ELTE Eötvös Napok keretében volt május 13-án), a Neumann-nap (2003. november 6-án hagyományteremto szándékkal) és a Térinformatikai Világnap programjában volt az elso, való részvétel (2003. november 19.). Az Informatikai Kar oktatói aktív szerepet játszottak az Algoritmusok (Muszaki Könyvkiadó, 1997), az Osztott algoritmusok, (Kiskapu Kiadó, 2002), a Párhuzamos algoritmusok (ELTE Eötvös Kiadó, 2003), a Programozási nyelvek (Kiskapu Kiadó, 2003) és az Új algoritmusok (Scolar Kiadó, 2003) címu tankönyvek megjelenésében. informatikus alapképAz Informatikai algoritmusok címu tankönyvet a programtervezo zés Bevezetés a matematikába, Programozás módszertani alapjai, Számításelmélet, Numerikus módszerek, Operációkutatás, Architektúrák és operációs rendszerek, Az adatbázisok elméleti alapjai és a Számítógépes graka címu tantárgyaihoz fogjuk tankönyvként használni. matematikus mesterképzésben a tankönyvet az AdatbázisA jelenlegi programtervezo rendszerek, Graka, Hálózatok, Komputeralgebra, Mesterséges intelligencia, Operációkutatás, Párhuzamos rendszerek, Térinformatika sávok oktatásában hasznosítjuk. kezdve az Oktatási Minisztérium támogatja elektronikus tankönyvek létreho2004-tol zását. A pályázaton 4 informatikai és 6 matematikai könyv kapott támogatást. Ezek közül 4 elektronikus könyvnek Fóthi Ákos és Horváth Zoltán (Bevezetés a programozásba), Informatikai algoritmusok I.), Iványi Antal (Párhuzamos Iványi Antal (szerkeszto algoritmusok), Stoyan Gisbert (Numerikus módszerek I.) és három nyomtatott könyvnek Demetrovics János és Békéssy András (Adatbázisrendszerek), Iványi Antal (Informatikai az ELTE IK oktatói. algoritmusok I., II.) és Stoyan Gisbert (Mathlab 6.5.) a szerzoi Ugyancsak támogatást kapott Klinghammer István, Mosonyi László és Török Zsolt A Kárpát-medence tektonikus térképei címu CD-je. Budapest, 2004. szeptember 15. Dr. Kozma László dékán
805
Színes ábrák és ismertetok
Eszterházy Károly Foiskola Természettudományi Kar MATEMATIKAI ÉS INFORMATIKAI INTÉZETE
3300 Eger, Leányka út 4. E-mail:
[email protected] Telefon:06 (36) 520-400
/ 4223 Fax: 06 (36) 520-478
ESZTERHÁZY KÁROLY FOISKOLA MATEMATIKAI ÉS INFORMATIKAI INTÉZETE Az MM 51018/1989.-XVI. sz. ügyiratában Pusztai Ferenc az Akadémia egyetértésével a EKF eloterjesztésére 1989 szeptember 1-tol számítástechnika szakot alapított, amelynek alapján a foiskolánkon az 1989-90-es tanévben matematika-számítástechnika szakon az országban elsoként elindult a szakos tanárok képzése. A késobbi évek során valamennyi foiskola az engedélyezett tanterv és szakalapítás alapján elindította a számítástechnika szakos tanárképzést. Az eltelt több mint 10 évben közel 1000 számítástechnika szakos általános iskolai tanári diplomát adtunk ki nappali és esti tagozaton. A felhalmozott óriási szakmai tapasztalat és a Debreceni Egyetem támogatásának eredményeként a foiskolák között eloször 2002/2003-as tanévben elindult a programozó évfolyama nappali és esti tagozaton. matematikus szak elso informatikus alapszak (BsC) 2005-ös 2004 oszén beadjuk a programtervezo indításának kérelmét. Foiskolánk 2004-ben akkreditálta az informatikus könyvtáros egyetemi szakot, így a foiskolai meglévo szakok mellett már egyetemi szinten is tanulhatnak intézményünkben informatikát a hallgatók. közalkalmaA Matematikai és Informatikai Intézetnek 12 foállású, teljes munkaidos minosített 3 éven zotti munkaviszonnyal rendelkezo oktatója van, 1 éven belül további 2 fo, szerzi meg a PhD tudományos fokozatot. Ezzel biztosított a minoségi belül további 4 fo informatikai képzés iránti elkötelezettség. Az Informatikai algoritmusok címu könyvet elsosorban a számítástechnika tanári informatikus alapszakon fogjuk használni. 2004-ben az szakon és a programtervezo Oktatási Minisztérium által meghirdetett pályázat támogatja az elektronikus tankönyvek létrehozását. A pályázaton négy elektronikus informatikai könyv kapott támogatást, egy az Informatikai algoritmusok. amelybol C# programozási Az Eszterházy Károly Foiskola oktatóinak gondozásában készülo nyelv címu elektronikus tankönyv szintén a sikeres pályázók körébe tartozik. az interneten Az intézettel és a képzésekkel kapcsolatos további információk elérhetok a http://matinf.ektf.hu címen. Eger, 2004. szeptember 10. Dr. Kovács Emod foiskolai tanszékvezeto docens
806
Színes ábrák és ismertetok
SZEGEDI TUDOMÁNYEGYETEM TERMÉSZETTUDOMÁNYI KAR INFORMATIKAI TANSZÉKCSOPORT 6720 Szeged, Árpád tér 2. Levelezési cím: 6701 Szeged, Postaók 652. Telefon:
+36 62 546396, Fax: +36 62 546-397
E-mail:
[email protected]
SZEGEDI TUDOMÁNYEGYETEM INFORMATIKAI TANSZÉKCSOPORTJA A Szegedi Tudományegyetem Természettudományi Kara 1921-ben kezdte meg muködését, amikor Szeged városa befogadta a Kolozsvárról áttelepült tudományegyetemet. A Természettudományi Kar oktatási és kutatási tevékenységét tudományterületi alapon felosztotta intézetei, tanszékcsoportjai között. Hat tanszékcsoport muködik, amelyek mindegyike részben önálló kutató és oktató intézetként is felfogható. A Szegedi Tudományegyetem képzési rendszerén belül az Informatikai Tanszékcsoport öt, az informatika tudományághoz tartozó szaknak a matematikus gazdája: programozó matematikus szak, programtervezo szak, közgazdasági programozó matematikus szak, muszaki informatikai szak és informatika tanár szak. Az Informatikai Tanszékcsoport 1990ben alakult, ekkor vette át a nagy múltú szegedi informatikusképzés gondozását a TTK Matematikai Tanszékcsoportjától. A öt tanszéket (Alkalmazott Informatika Tanszék, Képfeldolgozás és Számítógépes Graka Tanszék, Számítástudomány Alapjai Tanszék, Számítógépes Algoritmusok és Mesterséges Intelligencia Tanszék, Szoftverfejlesztés Tanszék) magában foglaló Informatikai Tanszékcsoport oktató- és kutatómunkáját az MTA-SZTE Mesterséges is nyitva Intelligencia Tanszéki Kutatócsoport is segíti. A hallgatóink elott álló intézeti könyvtárunk folyamatosan bovül, könyvállománya meghaladja A Tanszékcsoaz 5000 kötetet és közel 200 tudományos folyóirat is elérheto. port a gyakorlati oktatásra kiválóan felszerelt számítógépes kabinettermeket üzemeltet, amelyekben a hallgatók a tantervi órákon kívül is dolgozhatnak és számukra a szabad Internet-hozzáférés is biztosított. A hallgatóink bekapcsolódhatnak a tanszékeken folyó kutatásokba, és ezt végzés után folytathatják PhD képzés keretében. A tudományos munka eredményeként rendszeresen színvonalas Országos Tudományos Diákköri dolgo zatok születnek. A Tanszékcsoport lehetoség szerint támogatja a hallgatók külföldi részképzését. Ennek érdekében külföldi partnerekkel több nemzetközi projektben vesz részt az Intézet, melynek eredményeként számos hall gató élhet a külföldi részképzés lehetoségével. sport és kulturális élete ragyogó lehetoségeket Szeged város pezsgo nyújt a tanulás mellett pihenni, kikapcsolódni és szórakozni vágyó hallgatóinknak. Szeged, 2004. szeptember 2. Dr. Csirik János egyetemi tanár tanszékcsoportvezeto
Színes ábrák és ismertetok
19.1. ábra. A beérkezési idoközök nagy változékonysága. Az 5.10. ábra színes változata.
19.2. ábra. A kerethosszak hisztogramja. Az 5.11. ábra színes változata.
807
808
Színes ábrák és ismertetok
19.3. ábra. Adatcsere diagram. Az 5.15. ábra színes változata
19.4. ábra. Késleltetések összegzése. Az 5.16. ábra színes változata
809
Színes ábrák és ismertetok
19.5. ábra. A sávszélesség hozzáadásának hatása a válaszidore. Az 5.19. ábra színes változata.
19.6. ábra. A Pareto-eloszlás 400 bájt várható érték és H változata.
= 0.55
Hurst-paraméter esetén. Az 5.28. ábra színes
810
Színes ábrák és ismertetok
19.7. ábra. Hálózati topológia. Az 5.50. ábra színes változata.
X1
= 2, 5, 8, 11, 13, 16, 21, 25 X
pn
X
1
X2
= 4, 9, 12, 18, 23, 27, 31, 34
ps
X
1
2, 8, 13, 21
5, 11, 16, 25
4, 12, 23, 31
összefésülés
L1
pn
X
2
ps 2
9, 18, 27, 34
összefésülés
= 2,4,8,12,13,21,23, 31
L2
= 5,9,11, 16,18,25,27, 34
összekeverés
L
= 2, 5,4, 9,8,11, 12,16, 13,18,21, 25,23, 27, 31, 34 összehasonlítás és csere 2,4,5, 8,9,11,12,13, 16,18,21,23,25,27, 31, 34
19.8. ábra. 16 szám rendezése a P´ - - ´ ´ ¨ ¨ algoritmussal. A 6.8. ábra színes változata.
811
Színes ábrák és ismertetok
19.9. ábra. A konstruktív tömörtest geometria alapmuveletei egy f implicit függvényu kúpra és egy g implicit függvényu gömbre: egyesítés (max( f , g)), metszet (min( f , g)), halmaz-különbség (min( f , −g)). A 15.9. ábra színes változata.
U \ U U 19.10. ábra. Összetett objektum felépítése halmazmuveletekkel. A CSG-fa gyökere az összetett objektumot, a levelei a primitíveket azonosítják. A többi csomópont a halmazmuveleteket adja meg (U: egyesítés, A 15.10. ábra színes változata.
/: különbség).
812
Színes ábrák és ismertetok
19.11. ábra. Az eredeti háló, valamint egyszer, kétszer és háromszor felosztott változatai. A 15.19. ábra színes változata.
19.12. ábra. Képszintézis virtuális kamerával. A 15.30. ábra színes változata.
19.13. ábra. Egy LANDSAT muhold felvétele: az RGB sávok és a sávokból összeállított kép. A 16.14. ábra színes változata
Színes ábrák és ismertetok
813
19.14. ábra. A hisztogram kiegyenlítéssel megnövelt kontrasztú kép. A 16.19. ábra színes változata.
19.15. ábra. Az erosen felnagyított kernel mozgása a képen (LANDSAT képrészlet). A 16.24. ábra színes változata.
814
Színes ábrák és ismertetok
19.16. ábra. A bal oldali kép az eredeti, míg a jobb oldali egy kilenc pontos (9
× 9 pixeles) medián-szurt kép. A
16.30. ábra színes változata.
19.17. ábra. A bal oldali kép az eredeti, a jobb oldali az emboss-szurt változat. A 16.31. ábra színes változata.
Színes ábrák és ismertetok
815
19.18. ábra. A bal oldali az eredeti kép, a jobb oldali a Laplace-szurt változata. A 16.32. ábra színes változata.
19.19. ábra. A bal oldali az eredeti kép, a jobb oldali az emboss-szurt változata. A 16.33. ábra színes változata.
816
Színes ábrák és ismertetok
19.20. ábra. A
τ rácsállandójú Dirac-δ sorozattal mintavételezett felszín. A 16.35. ábra ismétlése
19.21. ábra. Törökbálint domborzati modelljének perspektivikus megjelenítése északi irányból. A 16.36. ábra színes változata.