Informatikai algoritmusok (ELTE).pdf

November 26, 2017 | Author: danikaa3 | Category: N/A
Share Embed Donate


Short Description

Download Informatikai algoritmusok (ELTE).pdf...

Description

INFORMATIKAI ALGORITMUSOK I.

Iványi Antal alkotó szerkeszt®

INFORMATIKAI ALGORITMUSOK I.

ELTE Eötvös Kiadó, Budapest, 2004

A könyv az Oktatási Minisztérium támogatásával, a  Felsooktatási Pályázatok Irodája által lebonyolított  felsooktatási tankönyvtámogatási program keretében jelent meg.

 Iványi Antal Alkotó szerkeszto:  Szerzok: Kása Zoltán (1.), Járai Antal és Kovács Attila (2.), Jörg Rothe (3. és 4.), Gyires Tibor (5.), Iványi Antal és Claudia Leopold (6.), Eberhard Zehendner (7.), Szidarovszky Ferenc (8.), Vizvári Béla (9.), Ulrich Tamm (10.), Balogh Ádám és Iványi Antal (11.), Demetrovics János és Sali Attila (12.), Miklós István (13.), Ingo Althöfer és Stefan Schwartz (14.), Szirmay-Kalos László (15.), Elek István és Sidló Csaba (16.), Galántai Aurél és Jeney András (17.) Szakmai lektorok: Fekete István (1.), Rónyai Lajos (2.), Gonda János (3.), Ivanyos Gábor (4.),   (6. és 7.), Mayer János (8.), Csirik János (9.), Fridli Sándor (10.), Toke Pál (5.), Sima Dezso Varga László (11.), Kiss Attila (12.), Hunyadvári László és Katsányi István (13.), Szántai Tamás (14.), Vida János (15.), Meskó Attila (16.), Szántai Tamás (17.) Nyelvi lektor: Biró Gabriella Fordítók: Láng Zsuzsa (3.), Sidló Csaba (4.), Roszik János és Sztrik János (5.), Szakács Laura (7.), Pintér Miklós (8.), Sike Sándor (10.), Belényesi Viktor és Nikovits Tibor (14.) A könyv címoldalán – a Szépmuvészeti  Múzeum engedélyével és az ELTE Informatikai Karának támogatásával – Vasarely Victor Dirac címu  festménye látható. A borítóhoz felhasznált lmet a GOMA RT. bocsátotta rendelkezésünkre. A borítót Iványi Antal tervezte. c Ingo Althöfer, Balogh Ádám, Belényesi Viktor, Biró Gabriella, Csirik János, Demetrovics János,

Elek István, Fekete István, Fridli Sándor, Galántai Aurél, Gonda János, Gyires Tibor, Hunyadvári László, Iványi Anna, Iványi Antal, Ivanyos Gábor, Járai Antal, Jeney András, Katsányi István, Kása Zoltán, Kovács Attila, Láng Zsuzsa, Claudia Leopold, Locher Kornél, Lukács András, Mayer János, Meskó Attila, Miklós István, Nikovits Tibor, Pintér Miklós, Roszik János, Rónyai Lajos, Jörg Rothe,  Sike Sándor, Szakács Laura, Szántai Tamás, Sali Attila, Stefan Schwarz, Sidló Csaba, Sima Dezso,  Szidarovszky Ferenc, Szirmay-Kalos László, Sztrik János, Ulrich Tamm, Toke Pál, Varga László, Vida János, Vizvári Béla, Eberhard Zehendner, 2004 c Hungarian printed edition ELTE Eötvös Kiadó, 2004

ISBN: 963 463 664 0 Kiadja az ELTE Eötvös Kiadó 1051 Budapest, Szerb utca 21. Telefon: 411-6740, Fax: 485-52-26 Honlap: http://www.elte.hu/szervezet/eotvos_kiado.html Elektronikus cím: [email protected]  kiadó: Pándi András Felelos Nyomás és kötés: Debreceni Kinizsi Nyomda  vezeto:  Bördos  János Felelos

Tartalomjegyzék

Tartalomjegyzék . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

 Eloszó . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

I.

ALAPOK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

1.

Rekurzív egyenletek (Kása Zoltán) . . . . . . . . . . . . . . . . . . . . . . . .

14

1.1.

Lineáris rekurzív egyenletek

. . . . . . . . . . . . . . . . . . . . . . . . .

15

1.2.

Generátorfüggvények és rekurzív egyenletek . . . . . . . . . . . . . . . . .

22

1.3.

Numerikus megoldás

36

2.

3.

4.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

2.1.

Komputeralgebra (Járai Antal és Kovács Attila)

Adatábrázolás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

39

2.2.

Polinomok közös gyökei

. . . . . . . . . . . . . . . . . . . . . . . . . . .

44

2.3.

Gröbner-bázis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63

2.4.

Szimbolikus integrálás

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

71

2.5.

Elmélet és gyakorlat

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

Kriptográa (Jörg Rothe) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

3.1.

Alapok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

95

3.2.

Kulcscsere Diffie és Hellman szerint . . . . . . . . . . . . . . . . . . . . .

107

3.3.

RSA és faktorizálás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

110

3.4.

Rivest, Rabi és Sherman protokolljai . . . . . . . . . . . . . . . . . . . . .

116

3.5.

Interaktív bizonyítási rendszerek és zéró ismeret . . . . . . . . . . . . . . .

116

Bonyolultságelmélet (Jörg Rothe) . . . . . . . . . . . . . . . . . . . . . . . . .

125

4.1.

Alapok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

126

4.2.

NP-teljesség . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

133

4.3.

 Az ítéletlogika kielégíthetoség-problémája . . . . . . . . . . . . . . . . . .

139

4.4.

Grázomorzmus és alsóság . . . . . . . . . . . . . . . . . . . . . . . . .

144

6 II.

Tartalomjegyzék

HÁLÓZATOK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

162

Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

163

5.

Hálózatok szimulációja (Gyires Tibor) . . . . . . . . . . . . . . . . . . . . . .

164

5.1.

A szimuláció típusai

164

5.2.

A telekommunikációs hálózatok modellezésének és szimulációjának szük-

5.3.

A telekommunikációs hálózatok típusai

5.4.

 szimulációhoz Teljesítményjellemzok

5.5.

A forgalom jellemzése

ségessége

6.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

165

. . . . . . . . . . . . . . . . . . .

167

. . . . . . . . . . . . . . . . . . . .

169

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

172

5.6.

 rendszerek . . . . . . . . . . . . . . . . . . . . . . Szimulációs modellezo

178

5.7.

Modellfejlesztési életciklus . . . . . . . . . . . . . . . . . . . . . . . . . .

189

5.8.

A forgalom ingadozásának hatása nagy sebességu  hálózatokra

. . . . . . .

195

5.9.

Mérési adatok bemutatása . . . . . . . . . . . . . . . . . . . . . . . . . . .

210

. . . . . . . . . .

222

6.1.

Párhuzamos architektúrák . . . . . . . . . . . . . . . . . . . . . . . . . . .

224

6.2.

Hatékonysági mértékek és optimalizálás . . . . . . . . . . . . . . . . . . .

227

6.3.

Párhuzamos programozás . . . . . . . . . . . . . . . . . . . . . . . . . . .

235

6.4.

Számítási modellek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

242

6.5.

PRAM algoritmusok

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

244

Szisztolikus rendszerek (Eberhard Zehendner) . . . . . . . . . . . . . . . . .

268

7.1.

A szisztolika alapfogalmai

268

7.2.

 Tér-ido-leképezés és szisztolikus rács

. . . . . . . . . . . . . . . . . . . .

278

7.3.

A be/kiviteli séma levezetése . . . . . . . . . . . . . . . . . . . . . . . . .

287

7.4.

Vezérlési szempontok . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

295

7.5.

Lineáris szisztolikus rácsok . . . . . . . . . . . . . . . . . . . . . . . . . .

306

FOLYTONOS OPTIMALIZÁCIÓ . . . . . . . . . . . . . . . . . . . . . . .

312

 Eloszó . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

313

8.

. . . . . . . . . . . . . . . . . . . . . . .

314

8.1.

Véges játékok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

315

8.2.

Folytonos játékok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

320

8.3.

Az oligopol feladat

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

349

DISZKRÉT OPTIMALIZÁCIÓ . . . . . . . . . . . . . . . . . . . . . . . . .

362

Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

363

9.

Ütemezéselmélet (Vizvári Béla) . . . . . . . . . . . . . . . . . . . . . . . . . .

364

9.1.

Formális rendszer ütemezési feladatok osztályozására . . . . . . . . . . . .

365

9.2.

A Gantt-diagramok . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

368

9.3.

Ütemezési problémák egyetlen gépen

370

9.4.

Ütemezési problémák párhuzamos berendezéseken

9.5.

Az egyutas ütemezési probléma

9.6.

7.

III.

IV.

Párhuzamos számítások (Iványi Antal és Claudia Leopold)

. . . . . . . . . . . . . . . . . . . . . . . . . .

Játékelmélet (Szidarovszky Ferenc)

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

378

. . . . . . . . . . . . . . . . . . . . . . .

389

A többutas ütemezési probléma . . . . . . . . . . . . . . . . . . . . . . . .

397

7

Tartalomjegyzék

V.

ADATBÁZISKEZELÉS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

416

Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

417

10. Adattömörítés (Ulrich Tamm)

418

. . . . . . . . . . . . . . . . . . . . . . . . . .

10.1. Információelméleti eredmények

. . . . . . . . . . . . . . . . . . . . . . .

419

10.2. Aritmetikai kódolás és modellezés . . . . . . . . . . . . . . . . . . . . . .

429

10.3. Ziv–Lempel tömörítés . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

440

10.4. Burrows–Wheeler-transzformáció

. . . . . . . . . . . . . . . . . . . . . .

443

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

447

10.5. Képtömörítés

11. Memóriagazdálkodás (Balogh Ádám és Iványi Antal)

. . . . . . . . . . . . .

456

11.1. Partícionálás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

456

11.2. Lapcserélési algoritmusok

. . . . . . . . . . . . . . . . . . . . . . . . . .

470

11.3. Anomáliák . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

480

11.4. Állományok optimális elhelyezése . . . . . . . . . . . . . . . . . . . . . .

491

12. Relációs adatmodell tervezés (Demetrovics János és Sali Attila) . . . . . . . .

503

12.1. Bevezetés

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

 12.2. Funkcionális függoségek

. . . . . . . . . . . . . . . . . . . . . . . . . . .

12.3. Relációs sémák szétvágása

VI.

503 504

. . . . . . . . . . . . . . . . . . . . . . . . . .

511

 12.4. Általános függoségek . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

530

ALKALMAZÁSOK

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

536

Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

537

13. Bioinformatika (Miklós István) . . . . . . . . . . . . . . . . . . . . . . . . . .

538

13.1. Algoritmusok szekvenciákon . . . . . . . . . . . . . . . . . . . . . . . . .

538

13.2. Algoritmusok fákon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

552

13.3. Algoritmusok sztochasztikus nyelvtanokon

. . . . . . . . . . . . . . . . .

554

13.4. Szerkezetek összehasonlítása . . . . . . . . . . . . . . . . . . . . . . . . .

560

13.5. Törzsfakészítés távolságon alapuló algoritmusokkal . . . . . . . . . . . . .

562

13.6. Válogatott témák

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

572

14. Ember-gép kölcsönhatás (Ingo Althöfer és Stefan Schwarz) . . . . . . . . . .

580

 14.1. Több választási lehetoséget kínáló rendszerek . . . . . . . . . . . . . . . .

580

 14.2. Több lehetséges megoldás eloállítása . . . . . . . . . . . . . . . . . . . . .

584

14.3. További interaktív problémamegoldó algoritmusok

. . . . . . . . . . . . .

600

15. Számítógépes graka (Szirmay-Kalos László) . . . . . . . . . . . . . . . . . .

605

15.1. Analitikus geometriai alapok . . . . . . . . . . . . . . . . . . . . . . . . .

605

15.2. Ponthalmazok leírása egyenletekkel

. . . . . . . . . . . . . . . . . . . . .

606

15.3. Geometriai feldolgozó és tesszellációs algoritmusok . . . . . . . . . . . . .

618

15.4. Tartalmazási algoritmusok

628

. . . . . . . . . . . . . . . . . . . . . . . . . .

15.5. Mozgatás, torzítás, geometriai transzformációk

. . . . . . . . . . . . . . .

637

15.6. Megjelenítés sugárkövetéssel . . . . . . . . . . . . . . . . . . . . . . . . .

645

15.7. Az inkrementális képszintézis algoritmusai

662

. . . . . . . . . . . . . . . . .

8

Tartalomjegyzék

16. Térinformatika (Elek István és Sidló Csaba)

. . . . . . . . . . . . . . . . . .

685

16.1. A térinformatika adatmodelljei . . . . . . . . . . . . . . . . . . . . . . . .

685

16.2. Térbeli indexelés

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

687

16.3. Digitális szurési  eljárások . . . . . . . . . . . . . . . . . . . . . . . . . . .

694

16.4. Mintavételezés

710

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17. Tudományos számítások (Galántai Aurél és Jeney András)

. . . . . . . . . .

717

 17.1. Lebegopontos aritmetika és hibaelemzés . . . . . . . . . . . . . . . . . . .

717

17.2. Lineáris egyenletrendszerek

. . . . . . . . . . . . . . . . . . . . . . . . .

727

17.3. Sajátértékszámítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

748

17.4. Numerikus programkönyvtárak és szoftvereszközök . . . . . . . . . . . . .

758

Irodalomjegyzék . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

769

Tárgymutató . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

787

 Színes ábrák és ismertetok

799

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

El®szó

Az informatikai algoritmusok magyar nyelvu  szakirodalma az utóbbi huszonöt évben ala szakkönyvet Lovász László és Gács Péter írta 1978-ban [295]. Ezt a könykult ki. Az elso vet fordítások követték: 1982-ben Aho, Hopcroft és Ullman [6] könyve, 1987-ben Knuth háromkötetes monográája [258, 259, 260], majd 1987-ben Cormen, Leiserson és Rivest  következtek – Rónyai Lajos, Ivanyos Gábor és muve  [89]. 1999-ben újra hazai szerzok Szabó Réka [392] – majd 2002-ben megjelent Lynch Osztott algoritmusok címu  monográája [301]. Ezt 2003 tavaszán Iványi Antal Párhuzamos algoritmusok címu  könyve [221], majd  2003 oszén – Új algoritmusok címmel – Cormen, Leiserson, Rivest és Stein tankönyvének [90] fordítása követte.  A magyar informatikus hallgatók és gyakorlati szakemberek nagy érdeklodéssel fogadták az Új algoritmusokat – néhány hónap alatt a kiadott 2000 példány fele gazdára talált.  Ez ösztönözte ennek a könyvnek a hazai szerzoit, hogy – külföldi kollégáik segítségével – további informatikai területek algoritmusait is összefoglalják. A könyv tartalmát hat részre tagoljuk: Alapok, Hálózatok, Diszkrét optimalizálás, Folytonos optimalizálás, Adatbázisok és Alkalmazások.  kötetbe azok a fejezetek került, amelyek szeptemberig elkészültek. Minden Az elso fejezet bemutat egy alkalmazási vagy elméleti szempontból lényeges területet és azokhoz kapcsolódó algoritmusokat. Az algoritmusok többségét szóban és olyan pszeudokóddal is  olvasók számára könnyen értmegadjuk, amely a programozási tapasztalattal rendelkezo  heto.  kötet 247 ábrát, 157 pszeudokódot és 133 példát tartalmaz, amelyek elose Az elso gítik a tárgyalt algoritmusok muködésének  megértését. Az önálló tanulást az alfejezetek  gyakorlatok (összesen 269), az egyes témákban való elmélyülést pedig a fejevégén lévo  (összesen 66) feladatok segítik. A fejezetek anyagával kapcsolatos friss zetek végén lévo  ismeretekre való utalások találhatók a fejezetek végén lévo  Megjegyzések a és kiegészíto fejezethez címu  részben. Az irodalomjegyzékben megadjuk egyrészt a felhasznált szakirodalom bibliográai adatait, másrészt – teljességre törekedve – felsoroljuk a magyar nyelvu  forrásokat.    és memóAz algoritmusok bemutatása az igényelt eroforrások – elsosorban futási ido  korlátoria – elemzését is magában foglalja. A szakirodalomban szokásos módon felso  eroforrásigényre,  kat adunk meg a legrosszabb esetre jellemzo és esetenként a megoldandó   alsó korlátot is levezetünk. probléma eroforrásigényére jellemzo AT X kiadványszerkeszto  eszköz segítségével készítettük, amelyet A könyv kéziratát HL E

10

Eloszó 

az elmúlt hat év során Belényesi Viktorral és Locher Kornéllal fejlesztettünk ki, és korábban  már három könyv kéziratának eloállítására használtunk. Az ábrák többségét Locher Kornél  rajzolta. Az irodalomjegyzéket Iványi Anna tette élové. Garey és Johnson klasszikus muvét  [149] követve mindazon algoritmusok futási idejét  korlát. exponenciálisnak nevezzük, amelyekre nem adható polinomiális felso Az Új algoritmusok példáját követve tizedespontot használunk. Mindig különös gondot fordítunk könyveink külsejére. Az adott esetben olyan megoldást kerestünk, amely



 kötet 17 és a második kötet hasonló számú tükrözi a könyv tartalmi gazdagságát (az elso fejezetét)



 és az alkotók szoros kötodését mind Magyarországhoz, mind pedig Európához.  Úgy gondoljuk, hogy a pécsi születésu  Vásárhelyi Viktor – aki francia festoként Victor

 a formák és színek gazdagsága, életútja Vasarely néven vált világhíruvé  – képeire jellemzo  pedig tükrözi kultúránk európai kötodését. A budapesti és pécsi múzeumokban összesen közel 500 Vasarely-alkotás van. Ezek a  muvész  ajándékai – a szüloföld iránti hála és tisztelet szimbólumai. Vasarely gazdag élet a könyv alkotói és majdani olvasói segítségével választottunk. A szavazók a Dirac, muvéb  ol Kubtuz, Rikka, Sixa és a Tupa-fond címu  képeket emelték ki. Közülük két olyan képet – a Dirac és a Kubtuz címu  festményeket – választottuk, amelyeken szakaszokból kör alakul ki  tulajdonságát, hogy a folytonos valós világot – szemléltetve az informatika azon alapveto diszkrét objektumokkal (bitekkel) írja le – és amelyekhez sikerült felhasználási engedélyt kapnunk. Közismert, hogy az elmúlt évszázadban nemcsak muvészeink,  hanem sok kiváló tudósunk is külföldön ért fel a csúcsra. Nagy részükre azonban folyamatosan számíthat a hazai  oktatás és tudományos élet. A hálózati szimulációs fejezet szerzoje Gyires Tibor (Illinois Egyetem), a játékelméleti fejezetet pedig Szidarovszky Ferenc (Arizonai Muszaki  Egyetem) írta. A második kötetben a megbízhatóságról szóló fejezetet Gács Péter (Bostoni Egyetem)   szóló fejezet egyik szerzoje  írta, a belsopontos módszerekrol pedig Terlaky Tamás (McMas az adott terület vezeto  kutatója, amerikai egyetemek ter Egyetem). Ma mind a négy szerzo professzora – egykor magyar egyetemen tanultak, majd tanítottak.  A rekurziós fejezet szerzoje Kása Zoltán (Babe¸ s-Bolyai Tudományegyetem), a sziszto szóló fejezetet Szakács Laura (Babe¸ likus rendszerekrol s-Bolyai Tudományegyetem) fordí magyarra. Részvételük a könyv megszületésében a határainkon túli magyar totta németrol nyelvu  oktatással való szoros kapcsolatunk része.  Könyvünk tartalmi gazdagsága jó külföldi – elsosorban német – kapcsolatainknak  Az elso  kötet kriptográai és bonyolultságelméleti fejezetét Jörg Rothe is köszönheto. (Düsseldor Egyetem), szisztolikus rendszerekkel foglalkozó fejezetét Eberhard Zehendner  (Friedrich Schiller Egyetem) írta. Az adattömörítési fejezet szerzoje Ulrich Tamm (Chem nitzi Egyetem), a párhuzamos programozásról szóló fejezet egyik szerzoje Claudia Leopold  Ingo Althöfer (Kasseli Egyetem), az ember-gép kapcsolatokkal foglalkozó fejezet szerzoi és Stefan Schwartz (Friedrich Schiller Egyetem).   Az alkotók (szerzok, lektorok, fordítók és segítotársaik) többsége a hazai informatikai  felsooktatás meghatározó intézményeinek – Budapesti Corvinus Egyetem, Budapesti Mu  szaki és Gazdaságtudományi Egyetem, Budapesti Muszaki  Foiskola, Debreceni Egyetem, Eötvös Loránd Tudományegyetem, Miskolci Egyetem, Pécsi Tudományegyetem, Szegedi

11

Eloszó 

Tudományegyetem – oktatója.   Az Oktatási Minisztérium támogatásának köszönhetoen ez a tankönyv nagyon kedvezo áron juthat el az Olvasókhoz. Ugyancsak az Oktatási Minisztérium támogatásának köszön hogy 2005 tavaszától a könyv elektronikus változata is mindenki számára szabadon heto,  lesz. hozzáférheto Az alábbi kollégáknak köszönjük, hogy a tervezett könyv mindkét formáját támogatták: Fazekas Gábor egyetemi docens (Debreceni Egyetem Informatikai Karának dékánhelyettese), Imreh Balázs egyetemi docens (Szegedi Egyetem), Kása Zoltán egyetemi tanár (BBTE Matematikai és Informatikai Karának dékánhelyettese), Kozma László egyetemi docens (ELTE Informatikai Karának dékánja), Jörg Rothe egyetemi tanár (Heinrich Heine  foiskolai   Universität, Düsseldorf), Sima Dezso tanár (Budapesti Muszaki  Foiskola Neu mann János Informatikai Karának foigazgatója), Sidló Csaba PhD hallgató (ELTE Informatikai Doktori Iskola), Szeidl László egyetemi tanár (Pécsi Tudományegyetem Matematikai és Informatikai Intézet igazgatója), Szidarovszky Ferenc egyetemi tanár (Arizonai Muszaki  Egyetem), Szirmay-Kalos László egyetemi tanár (BME Villamosmérnöki és Informatikai Kara), Terlaky Tamás egyetemi tanár (McMaster Egyetem, Hamilton)  Ugyancsak köszönjük azoknak a kollégáinknak a segítokészségét, akiknek a lektori véleményét csatolni tudtuk a pályázathoz: Fekete István egyetemi docens (Rekurziók címu  fejezet), Fridli Sándor egyetemi docens (Adattömörítés), Gonda János egyetemi docens (Kriptográa), Hunyadvári László egyetemi docens és Katsányi István PhD hallgató (Bioinfor matika), Kiss Attila egyetemi docens (Relációs adatbázisok tervezése), Toke Pál egyetemi docens (Hálózatok szimulációja), Vida János egyetemi docens (Graka). Az elektronikus változat elkészültéig a

http://people.inf.elte.hu/tony/konyvek/infalg  címu  honlapon találják meg olvasóink a könyv kiegészítését, amely többek között az élo irodalomjegyzéket, a névmutatót, a gyakorlatok és feladatok egy részének megoldását, mu  programokat, a talált hibák jegyzékét tartalmazza. Ezen a honlapon keresztül fogjuk ködo  Olvasóinkat tájékoztatni az elektronikus változat hálózati címérol. Köszönet illeti azokat – Belényesi Viktor, Thomas H. Cormen, Érsek Nándor, Pavel  Fabian, Johan Gade, Iványi Anna, Kimo Johnson, Shamir Kuller, Lorentey Károly, Stefan Schumann, Joel Seiferas, Beau Skinner, Ofer Springer, George Stephanides, Sekar Sundarraj, Szántai Tamás, Szeidl László, Ronald Tungl, Veszprémi Anna, David Wagner – akik  kiaészrevételeikkel segítettek a könyvünk alapjául szolgáló mu,  az Új algoritmusok elso dásának javításában.   Az elozetes érdeklodés alapján arra számítunk, hogy rövidesen újabb kiadásra lesz  kiadás hibáit kijavítani. Ezért kérjük a könyv Olvasóit, szükség. Ebben szeretnénk az elso hogy javaslataikat, észrevételeiket küldjék el a

[email protected] címre – levelükben le-

  hetoleg pontosan megjelölve a hiba elofordulási helyét, és megadva a javasolt szöveget.  és lektorok elektronikus címeit tartalmazó A könyv honlapján megtalálható a szerzok kolofonoldal. Olvasóink javaslataikkal, kérdéseikkel megkereshetik a könyv alkotóit. Budapest, 2004. szeptember 22. Iványi Antal  alkotó szerkeszto

I. ALAPOK

Bevezetés

Ebben az alapozó részben négy témakört tárgyalunk.  Az informatikai algoritmusok elemzése során gyakran elofordul, hogy például felismerjük az n és n

+ 1 méretu feladatok megoldási ideje közötti kapcsolatot – és ennek az úgy-

nevezett rekurzív egyenletnek a felhasználásával szeretnénk közvetlenül felírni az n méretu   Az elso  fejezet a rekurzív egyenletek leggyakrabban elofor bemenethez tartozó futási idot. duló típusainak megoldási módszereit mutatja be. A mai számítógépek sebessége és tárolókapacitása, valamint az elméleti eredmények  számos olyan feladat kényelmes (mechanikus) megoldását lehetové teszik, melyeket korábban nem, vagy csak nagy nehézségek árán tudtunk kezelni. Ezek egy része – mint a formális differenciálás és integrálás – a második fejezetben tárgyalt komputeralgebrához tartozik.  a kommunikáció Az elektronikus kommunikáció hatalmas iramú terjedésével együtt no  biztonságának jelentosége. Ezért a mai informatika egyik kulcsfontosságú területe a kriptográa, mellyel a könyv harmadik fejezete foglalkozik.  Az algoritmusok elemzésének hagyományosan fontos része az eroforrásigény leg korlátjának megadása. Az csak az utóbbi 15 évben vált rosszabb esetre vonatkozó felso  természetessé, hogy az eroforrásigényre vonatkozó – a probléma és a megengedett algoritmusok tulajdonságain alapuló – alsó korlátokat is megadnak. Például Donald Knuth The Art of Computer Programming címu  monográájának 1968 kötetében szerepelt az aszimptotikus felso  korlátok jellemzésére használt ban megjelent elso O-jelölés (nagy ordo) deníciója – ugyanakkor még nem szerepelt az alsó korlátok jellemzésére alkalmas

Ω-jelölés, valamint a pontos nagyságrend megadására alkalmas Θ-jelölés. Az

 kiadásában, a Distributed Algorithms Introduction to Algorithms 1990-ben megjelent elso  kiadásában, valamint Knuth könyvének 1997-ben megjelent har1996-ban megjelent elso madik kiadásában már az

Ω-jelölés és a Θ-jelölés deníciója is szerepel.

A negyedik fejezet szerint a bonyolultságelmélet fontos feladata, hogy a problémákhoz és számítási modellekhez minél pontosabb alsó korlátokat adjon meg – ezzel is segítve a  problémák eroforrásigény szerinti osztályozását. A második kötetben fog megjelenni az algebrai algoritmusok elemzése.

1. Rekurzív egyenletek

Közismert a Fibonacci-számok rekurzív deníciója: ha F n jelöli az n-edik Fibonacciszámot, akkor F0 F n+2

=

= 0,

F n+1

F1

=1,

+ Fn ,

ha n

≥0.

 Szeretnénk explicit formában megadni F n értékét tetszoleges n-re. A feladat tulajdonképpen olyan egyenlet megoldását kéri, amelyben az ismeretlen rekurzív módon van megadva, ezért rekurzív egyenletnek hívjuk. Itt a megoldás felfogható úgy, mint természetes számokon értelmezett függvény, mivel F n minden n-re értelmezett. Az ilyen rekurzív egyenletet szokás még differenciaegyenletnek is nevezni, de nevezhetnénk akár diszkrét differenciálegyenletnek is. 1.1. deníció. A k-adrendu  rekurzív egyenlet (k f (xn , xn+1 , . . . , , xn+k )

≥ 1) egy = 0,

n

≥0

(1.1)

alakú egyenlet, ahol xn -et kell explicit formában megadnunk.  Ahhoz, hogy egyértelmuen  meghatározhassuk xn -et, meg kell adnunk k kezdoértéket, ezek  általában x0 , x1 , . . . , xk−1 . Ezek az értékadások kezdeti feltételeknek tekinthetok. Mivel a Fibonacci-számokat deniáló egyenlet másodrendu  rekurzív egyenlet, ezért ott két kezdeti értéket adunk meg.  xn Az (1.1) egyenletet és annak adott kezdeti feltételeit kielégíto adott egyenlet partikuláris megoldásának nevezzük. Ha az xn

=

=

g(n) sorozatot az

h(n, C 1 , C 2 , . . . , C k ) soro-

zatból – a C 1 , C 2 , . . . , C k állandók alkalmas megválasztásával – az (1.1) egyenlet minden  partikuláris megoldása eloállítható, akkor a sorozatot az egyenlet általános megoldásának nevezzük.  A rekurzív egyenletek megoldása általában nem egyszeru.  A következokben sajátos esetekben alkalmazható módszereket ismertetünk. Az írásmódban függvény helyett inkább sorozatot használunk (ami tulajdonképpen természetes számokon értelmezett függvény). Így a jelölés egyszerubb  lesz, x(n) helyett mindenhol xn -t írunk.  áll. Az 1.1. alfejezetben a lineáris rekurzív egyenletek megA fejezet három részbol oldásával, a 1.2. alfejezetben a generátorfüggvények felhasználásával, az 1.3. alfejezetben pedig lineáris rekurzív egyenletek numerikus megoldásával foglalkozunk.

15

1.1. Lineáris rekurzív egyenletek

1.1. Lineáris rekurzív egyenletek Ha a rekurzív egyenlet f0 (n)xn

+

f1 (n)xn+1

+ ··· +

fk (n)xn+k

=

f (n),

n

≥0

alakú, ahol f , f0 , f1 , . . . , fk természetes számokon értelmezett függvények, f0 , fk

,

0, és

 beszélünk. Ha xn -et kell explicit módon megadnunk, akkor lineáris rekurzív egyenletrol f azonosan nulla, akkor az egyenlet homogén, és különben inhomogén. Amennyiben az f0 , f1 , . . . , fk függvények mindegyike állandó, akkor állandó együtthatós lineáris rekurzív  van szó. egyenletrol

1.1.1. Állandó együtthatós homogén lineáris rekurzív egyenletek Legyen a0 xn

+ a1 xn+1 + · · · + ak xn+k = 0,

ahol a0 , a1 , . . . , ak valós állandók, a0 , ak

, 0,

k



n

≥k,

(1.2)

1. Amennyiben adva van k kezdeti érték

(leggyakrabban x0 , x1 , . . . , xk−1 ), az egyenlet megoldása egyértelmuen  meghatározható. A megoldás érdekében rendeljük hozzá az egyenlethez a karakterisztikus egyenletét: a0

+ a1 r + · · · + ak−1 rk−1 + ak rk = 0 ,

(1.3)

amely valós együtthatós egyenlet. Ennek az egyenletnek k gyöke van a komplex számok   hogy ha r0 valós megoldása a karakterisztikus körében. Behelyettesítéssel ellenorizhet o, egyenletnek, akkor C 0 r

n 0

 megoldása az (1.2) egyenletnek, ahol C 0 tetszoleges állandó.

Az (1.2) egyenlet általános megoldása xn (i)

ahol xn (i

= C1 xn(1) + C2 xn(2) + · · · + Ck xn(k) ,

= 1, 2, . . . , k) az (1.2) egyenlet lineárisan független megoldásai. A kezdeti felté-

 mindig meghatározhatók a C 1 , C 2 , . . . , C k állandók egy k egyenletbol  álló egyentelekbol letrendszer megoldásával. A lineárisan független megoldásokat a karakterisztikus egyenlet gyökei szolgáltatják  szerint. Minden gyökhöz hozzárendelheto  egy fundamentálisnak nevezett a következok megoldás.  valós gyökök Különbözo  valós gyökei. EkLegyenek r1 , r2 , . . . , r p a karakterisztikus egyenlet egymástól különbözo kor n

n

r1 , r2 ,

...,

n

rp

megoldásai az (1.2) rekurzív egyenletnek, és n

C 1 r1  is az, tetszoleges C1 , C2 , általános megoldása.

...,

+ C2 r2n + · · · + C p rnp

C p állandókra. Ha p

=

(1.4)

k, akkor (1.4) a rekurzív egyenlet

16

1. Rekurzív egyenletek

1.1. példa. Oldjuk meg az

=

xn+2

+ xn ,

xn+1

x0

= 0,

x1

=1

rekurzív egyenletet. A karakterisztikus egyenlet r

−r−1=0 ,

2

amelynek gyökei

=

r1

1



+

5

2

,

r2

=

1





5

.

2

Ezek valósak és egymástól különböznek, tehát az egyenlet általános megoldása

xn

√ n √ n    1 + 5   1 − 5   + C2   . = C1  2

2

 Ha gyelembe vesszük, hogy x0 A C 1 és C 2 meghatározhatók a kezdeti feltételekbol.

=

0, x1

=

1, a

 egyenletrendszerhez jutunk: következo

C1

+ C2 √ − 5

C1



+

1

5

+ C2

2

1

2

=

0

,

=

1

.

√ √ = 1/ 5, C2 = −1/ 5 . Így az általános megoldás √ n √ n   1  1   1 + 5   1 − 5  = √   − √   ,

Az egyenletrendszer megoldása C 1

xn

2

5

2

5

amely éppen F n , az n-edik Fibonacci-szám.

Többszörös valós gyökök Legyen r egy p-szeres gyöke a karakterisztikus egyenletnek. Ekkor r

n

,

nr

n

,

2 n

n r

, ...,

n

p−1 n

r

megoldásai az (1.2) rekurzív egyenletnek (az r többszörös gyökhöz tartozó fundamentális megoldások), és C0

+ C1 n + C2 n2 + · · · + C p−1 n p−1

 is megoldás, tetszoleges C0 , C1 ,

...,



r

n

C p−1 állandókra. Ha a karakterisztikus egyenletnek

nincs más gyöke, akkor (1.5) a rekurzív egyenlet általános megoldása. 1.2. példa. Oldjuk meg az xn+2

= 4xn+1 − 4xn ,

x0

= 1,

rekurzív egyenletet. A karakterisztikus egyenlet r amelynek r

2

− 4r + 4 = 0 ,

= 2 kétszeres gyöke. Ekkor xn

megoldása az egyenletnek.

(1.5)

= (C0 + C1 n)2n

x1

=3

17

1.1. Lineáris rekurzív egyenletek

 A kezdeti feltételekbol

2C 0 Innen C 0

C0

=

1

,

+ 2C1

=

3

.

= 1, C1 = 1/2, azaz az általános megoldás =

xn

1

+

1 2

! n

n 2

vagy

= (n + 2)2n−1 .

xn

Egyszeres komplex gyökök Ha a trigonometrikus alakban felírt a(cos b + i sin b) komplex szám gyöke a karakterisztikus egyenletnek, akkor az a(cos b



i sin b) konjugált is az, mivel a karakterisztikus egyenlet

valós együtthatós. Ekkor n

a cos bn

és

n

a sin bn

megoldása az (1.2) rekurzív egyenletnek és n

C 1 a cos bn

+ C2 an sin bn

(1.6)

 is az, tetszoleges C 1 és C 2 állandókra. Ha a karakterisztikus egyenletnek nincsenek más gyökei, akkor (1.6) általános megoldás. 1.3. példa. Oldjuk meg az xn+2

= 2xn+1 − 2xn ,

= 0,

x0

x1

=1

rekurzív egyenletet. A karakterisztikus egyenlet

r

amelynek gyökei 1

2

− 2r + 2 = 0 ,

+ i és 1 − i, trigonometrikus alakban:



2(cos(π/4)

i sin(π/4)). Ezért a rekurzív egyenletnek

xn

= C1 (



n

2) cos



+ C2 (

4



n

2) sin

nπ 4

 megoldása. A kezdeti feltételekbol

√ C1

Innen azt kapjuk, hogy C 1

= 0,

C2

2 cos

π 4

+ C2

C1



2 sin

π 4

=

0

,

=

1

.

= 1. Az általános megoldás tehát xn

=

√ n 2

sin

nπ 4

.

+ i sin(π/4)) és



2(cos(π/4)



18

1. Rekurzív egyenletek

Többszörös komplex gyökök Ha a trigonometrikus alakban felírt a(cos b + i sin b) komplex szám p-szeres gyöke a karak-

− i sin b) konjugált is az.

terisztikus egyenletnek, akkor az a(cos b Ekkor az (1.2) rekurzív egyenletnek n

n

...,

n

n

...,

n

a cos bn, na cos bn, és n

a sin bn, na sin bn,

p−1

p−1

n

a cos bn

n

a sin bn

megoldásai. Ekkor megoldás (C 0

+ C1 n + · · · + C p−1 n p−1 )an cos bn + (D0 + D1 n + · · · + D p−1 n p−1 )an sin bn

 is, ahol C 0 , C 1 , . . . , C p−1 , D0 , D1 , . . . , D p−1 tetszoleges állandók, amelyek meghatározhatók  Ez általános megoldás, ha a karakterisztikus egyenletnek nincsenek a kezdeti feltételekbol. más gyökei. 1.4. példa. Oldjuk meg az xn+4

+ 2xn+2 + xn = 0,

x0

= 0,

x1

= 1,

x2

= 2,

x3

=3

rekurzív egyenletet. A karakterisztikus egyenlet r amely (r

2

4

+ 2r2 + 1 = 0 ,

+ 1)2 = 0 alakban is írható, és amelynek i és −i kétszeres gyöke. Ezek trigonometrikus alakja i

= cos

π 2

π + i sin , 2

− i = cos

valamint

π 2

− i sin

π 2

Ezért az általános megoldás xn

= (C0 + C1 n) cos

nπ 2

+ (D0 + D1 n) sin

nπ 2

.

 következik: A kezdeti feltételekbol

(C 0

+ C1 ) cos

π 2

C0

+ (D0 + D1 ) sin

π 2

+ 2C1 ) cos π + (D0 + 2D1 ) sin π 3π 3π (C 0 + 3C 1 ) cos + (D0 + 3D1 ) sin (C 0

2

2

=

0

,

=

1

,

=

2

,

=

3

,

azaz

=

0

,

+ D1

=

1

,

−2C1

=

2

,

−D0 − 3D1

=

3

,

D0

és innen C 0

C0

= 0, C1 = −1, D0 = 3 és D1 = −2. Az általános megoldás tehát xn

= (3 − 2n) sin

nπ 2

− n cos

nπ 2

.

.

19

1.1. Lineáris rekurzív egyenletek

A most vizsgált négy eset segítségével bármilyen állandó együtthatós homogén egyenletet megoldhatunk. 1.5. példa. Oldjuk meg az xn+3

= 4xn+2 − 6xn+1 + 4xn ,

x0

= 0,

x1

= 1,

x2

=1

rekurzív egyenletet. A karakterisztikus egyenlet r

3

− 4r2 + 6r − 4 = 0 ,

+ i és 1 − i. Ezért az általános megoldás √ n √ n nπ nπ n + C3 2 sin . xn = C 1 2 + C 2 2 cos

amelynek gyökei: 2, 1

4

4

Az állandók meghatározása után

xn

n−1

= −2

+

√ n  2 2

cos

nπ 4



+ 3 sin

 .

4

Általános megoldás Az

(1.2)

k-adrendu 

homogén

lineáris

rekurzív

egyenlethez

rendelt

karakterisztikus

egyenletnek összesen k gyöke van a komplex számok között, amelyek nem feltétlenül   különbözok. Legyenek ezek a gyökök a következok: r1 valós, p1 -szeres ( p1 r2 valós, p2 -szeres, ( p2

≥ 1) ≥ 1)

, ,

...

≥ 1) , = a1 (cos b1 + i sin b1 ) komplex, q1 -szeres (q1 ≥ 1) = a2 (cos b2 + i sin b2 ) komplex, q2 -szeres (q2 ≥ 1)

rt valós, pt -szeres, ( pt s1 s2

, ,

... sm

= am (cos bm + i sin bm ) komplex, qm -szeres (qm ≥ 1)

Mivel összesen k gyök van, p1

.

+ p2 + · · · + pt + 2(q1 + q2 + · · · + qm ) = k.

Ekkor az (1.2) rekurzív egyenlet általános megoldása

xn

t X 

=

C

( j) 0

+ C1( j) n + · · · + C (pj)−1 n p −1

+

( j)

D

0

+ D(1j) n + · · · + D(qj)−1 nq −1

+

E

( j) 0

+ E1( j) n + · · · + Eq( j)−1 nq −1

j=1

ahol C

( j) 0

,

C

( j) 1

, ...,

C

( j) p j −1

,

j



j

j

j=1 m X 

= 1, 2, . . . , t ,

j

j

n

rj

j

j=1 m X 



j



n

a j cos b j n

n

a j sin b j n

,

(1.7)

20

1. Rekurzív egyenletek

(l)

D

0

,

E

(l) 0

,

(l)

D

1

,

E

(l) 1

, ...,

 meghatározhatók. feltételekbol

(l)

D

pl −1

,

E

(l) pl −1

,

= 1, 2, . . . , m

l

állandók, melyek a kezdeti

 tételben foglalhatók össze. Az eddigiek a következo 1.2. tétel. Legyen k



1 egész, a0 , a1 ,

. . . , ak

valós számok, a0 , ak

, 0.

Az (1.2) lineá-

ris rekurzív egyenlet általános megoldása eloállítható  az (17.39) karakterisztikus egyenlet j n

ri gyökeibol  képezett n ri alakú tagok lineáris kombinációjaként, ahol a pi -szeres ri gyök esetében 0

≤ j<

p és a lineáris kombináció együtthatói a kezdeti feltételektol  függnek.

A tétel bizonyítását az Olvasóra hagyjuk (lásd 1.1-5. gyakorlat).  A megoldás lépéseit a következoképpen foglalhatjuk össze. Feltesszük, hogy az egyenlet együtthatóit az A tömb, a megoldás állandóit pedig a C tömb tartalmazza. H ´ - ´ 1

írjuk fel a rekurzív egyenlet karakterisztikus egyenletét

2

keressük meg a karakterisztikus egyenlet összes gyökét, multiplicitásukkal együtt

3

írjuk fel az (1.7) általános megoldást a gyökök alapján

4

 ha léteznek, határozzuk meg az (1.7)-ben szereplo  állandókat a kezdeti feltételekbol,

1.1.2. Állandó együtthatós inhomogén lineáris rekurzív egyenletek Az állandó együtthatós inhomogén lineáris rekurzív egyenlet általános alakja a0 xn

+ a1 xn+1 + · · · + ak xn+k =

ahol a0 , a1 , . . . , ak valós állandók, a0 , ak

, 0,

k

≥ 1, és

f (n)

,

(1.8)

f (n) nem azonosan nulla.

Az egyenlethez tartozó (1.2) homogén lineáris egyenletet az 1.2. tétel szerint meg tudjuk oldani. Ha ismerjük az (1.8) egyenlet egy partikuláris megoldását, akkor az (1.8) egyenlet  tudjuk állítani. általános megoldását is elo 1.3. tétel. Legyen k



1 egész, a0 , a1 ,

. . . , ak

valós számok, a0 , ak

lineáris inhomogén rekurzív egyenlet egy partikuláris megoldása és

tartozó (1.2) homogén lineáris egyenlet általános megoldása, akkor xn

=

(0)

xn

+ xn(1)

általános megoldása az (1.8) egyenletnek. A tétel bizonyítását meghagyjuk az Olvasónak (lásd 1.1-6. gyakorlat). 1.6. példa. Oldjuk meg az xn+2

+ xn+1 − 2xn = 2n ,

x0

= 0,

 rekurzív egyenletet. Eloször megoldjuk az xn+2

+ xn+1 − 2xn = 0

x1

=1

, 0.

(0) xn

(1)

Ha xn

az (1.8)

az (1.8) egyenlethez

21

1.1. Lineáris rekurzív egyenletek

(1)

f (n)

xn

n a

p

n

(C 0

+ C1 n + · · · + C p n p )an

n

p

(C 0

+ C1 n + · · · + C p n p )an sin bn + (D0 + D1 n + · · · + D p n p )an cos bn

n

p

(C 0

+ C1 n + · · · + C p n p )an sin bn + (D0 + D1 n + · · · + D p n p )an cos bn

a n sin bn

a n cos bn

1.1. ábra. A partikuláris megoldás alakja.

homogén egyenletet, amelynek általános megoldása

= C1 (−2)n + C2 ,

(0)

xn

(1)

 mivel a karakterisztikus egyenlet gyökei −2 és 1. Könnyen ellenorizhetjük, hogy xn

= 2n−2 megoldása

az eredeti, inhomogén egyenletnek. Az inhomogén egyenlet általános megoldása tehát xn

= C1 (−2)n + C2 + 2n−2 .

 Ennek alapján az általános megoldás A C 1 és C 2 állandókat meghatározhatjuk a kezdeti feltételekbol.

xn

=−

1 4

(−2)

n

(

azaz xn

=

+ 2n−2

vagy

0,

xn

ha n páros

n−1

2

,

2

=

n

− (−2)n 4

,

,

ha n páratlan

.

A partikuláris megoldás meghatározható a konstansok variálásának módszerével. Léteznek azonban olyan esetek, amikor a partikuláris megoldást könnyebben is megkaphatjuk. (1)

Az 1.1. ábrán olyan f (n) függvényeket adunk meg, amelyek esetében az xn

partikuláris

 Az állandókat az egyenletbe való bemegoldás a táblázatban megadott alakban keresheto. helyettesítéssel kaphatjuk meg.

= 2n , tehát az elso esetet alkalmazzuk, amikor a = 2, p = -nel próbálkozunk. Behelyettesítés után azt kapjuk, hogy C 0 = 1/4, tehát a

 o  példánk esetében f (n) Eloz 0, ezért a C 0 2

n

partikuláris megoldás (1)

xn

= 2n−2 .

Gyakorlatok 1.1-1. Oldjuk meg az alábbi inhomogén lineáris rekurzív egyenletet: Hn

= 2Hn−1 + 1,

ha n

≥ 1,

és

H0

=0.

22

1. Rekurzív egyenletek

(Hn itt a Hanoi-tornyai nevu  feladat megoldásához szükséges – és egyben elégséges – lépések számát jelenti.) 1.1-2. Elemezzük a Hanoi-tornyaira vonatkozó feladatot abban az esetben, amikor úgy kell n korongot átrakni az A rúdról a C rúdra, hogy közben az A rúdról a C rúdra nem szabad korongot átrakni. Útmutatás. Mutassuk meg, hogy ha az optimális algoritmus lépéseinek száma Mn és n

≥ 1, akkor Mn = 3Mn−1 + 2.

 rekurzív egyenletet: 1.1-3. Oldjuk meg a következo (n

+ 1)Rn = 2(2n − 1)Rn−1 ,

≥ 1,

ha n

és

R0

= 1.

1.1-4. Oldjuk meg alábbi inhomogén lineáris rekurzív egyenletet:

= 2n − 2 + 2xn−1 ,

xn

ha n

≥ 2, n

Útmutatás. Keressük a partikuláris megoldást C 1 n2

1.1-5.? 1.1-6.?

és

x1

= 0.

+ C2 alakban.

Bizonyítsuk be az 1.2. tételt. Bizonyítsuk be az 1.3. tételt.

1.2. Generátorfüggvények és rekurzív egyenletek A generátorfüggvényeket, többek között, felhasználhatjuk rekurzív egyenletek megoldására, bizonyos objektumok (pl. bináris fák) megszámolására, azonosságok bizonyítására, partíciós problémák megoldására. Az objektumok megszámolása rekurzív egyenletek felállításával és megoldásával történik. Ezek a rekurzív egyenletek általában nem lineárisak, megoldásukban segíthetnek a generátorfüggvények.

1.2.1. Értelmezés és m¶veletek Egy (an )n≥0

= ha0 , a1 , a2 , . . . , an , . . .i végtelen számsorozathoz hozzárendelhetünk egy hat-

 ványsort a következoképpen: A(z)

= a0 + a1 z + a2 z2 + · · · + an zn + · · · =

X

n

an z

,

n≥0

amelyet az (an )n≥0 számsorozat generátorfüggvényének nevezünk.  Például a Fibonacci-számok esetében a generátorfüggvény a következo: F(z)

=

X

Fn z

n

= z + z2 + 2z3 + 3z4 + 5z5 + 8z6 + 13z7 + · · · .

n≥0 2

 Ha mindkét oldalt megszorozzuk z-vel, majd z -tel, a következoket kapjuk: F(z) zF(z) 2

z F(z)

= = =

F0

+ F1 z + F2 z2 + F3 z3 + · · · + Fn zn + · · · , 2 3 n F 0 z + F 1 z + F 2 z + · · · + F n−1 z + · · · , F0 z

2

+ F1 z3 + · · · + Fn−2 zn + · · · .

 képletbol  a másodikat, majd a harmadikat, és gyelembe Ha kivonjuk tagonként az elso

23

1.2. Generátorfüggvények és rekurzív egyenletek

 kapjuk: vesszük a Fibonacci-számokat deniáló képletet, a következot F(z)(1

− z − z2 ) = z ,

ahonnan F(z)

z

=

1

.

− z − z2

(1.9)

A fenti számítások helyességét matematikailag igazolni lehet, de nem térünk ki erre. A generátorfüggvények segítségével, formális muveletek  során kapott eredményeket a legtöbb esetben más módszerekkel is lehet igazolni. Tekintsük az A(z)

=

X

n

an z és B(z)

=

X

n≥0

n

bn z n≥0

generátorfüggvényeket. Az A(z) és B(z) generátorfüggvényeket akkor és csakis akkor mondjuk egyenlonek,  ha an

= bn

bármely n természetes számra.

 generátorfüggvényekkel végezheto  muveleteket Ezután a következo,  deniáljuk: összeadás és valós számmal való szorzás, eltolás, szorzás, deriválás, integrálás. Összeadás és valós számmal való szorzás

αA(z) + β B(z) =

X

(αan

+ βbn )zn .

n≥0

Eltolás A k

z A(z)

=

X

n+k

an z n≥0

X

n

an−k z n≥k

< 0, 0, . . . , 0, a0 , a1 , . . . > | {z }

generátorfüggvény a

=

számsorozatot jelképezi, míg az

k

1 z

k

(A(z)

− a0 − a1 z − a2 z2 − · · · − ak−1 zk−1 ) =

X

n−k

an z

< ak , ak+1 , ak+2 , . . . >

1.7. példa. Legyen A(z)

= 1 + z + z2 + · · · . Ekkor  1 A(z) − 1 = A(z) z

X

n

ak+n z n≥0

n≥k

generátorfüggvény az

=

sorozatot.

és

A(z)

=

1 1

−z

.

Szorzás Ha A(z) és B(z) generátorfüggvények, akkor A(z)B(z)

= = =

+ a1 z + · · · + an zn + · · · )(b0 + b1 z + · · · + bn zn + · · · ) 2 a0 b0 + (a0 b1 + a1 b0 )z + (a0 b2 + a1 b1 + a2 b0 )z + · · · X

(a0

n

sn z n≥0

,

24

1. Rekurzív egyenletek

ahol sn

=

n X

ak bn−k .

k=0

Sajátos eset. Ha bn

= 1 bármely n természetes számra, akkor  n  X X  1  = A(z)  ak  zn . 1−z n≥0 k =0

(1.10)

= 1 is igaz bármely n természetes számra, akkor

Ha még ezenkívül an

1

− z)

(1

X

=

2

(n

+ 1)zn .

(1.11)

n≥0

Deriválás

0

A (z)

X

= a1 + 2a2 z + 3a3 z2 + · · · =

(n

+ 1)an+1 zn .

n≥0

1.8. példa. Az A(z)

X

=

z

=

n

n≥0

1 1

−z

generátorfüggvény mindkét oldalát deriválva azt kapjuk, hogy

0 A (z)

X

=

nz

n−1

=

n≥1

1 (1

− z)2

.

Integrálás

Z

z

A(t)dt

= a0 z +

0

1 2

2

+

a1 z

1 3

a2 z

3

+ ··· =

X1 n≥1

n

an−1 z

n

1.9. példa. Legyen 1 1

−z

= 1 + z + z2 + z3 + · · ·

Mindkét oldalát integrálva azt kapjuk, hogy

ln

1 1

=z+

−z

1 2

2

z

+

1 3

3

z

+ ··· =

X n≥1

1 n

z

n

.

Ha a két fenti generátorfüggvényt összeszorozzuk, akkor 1 1

ahol Hn

=1+

1 2

+

1 3

+ ··· +

1 n

(H0

−z

= 0,

ln

1 1

H1

−z

=

X Hn z

n

,

n≥1

= 1) az ún. harmonikus számok.

.

25

1.2. Generátorfüggvények és rekurzív egyenletek

Argumentum cseréje Legyen A(z)

P

n

P

=

< a0 , a1 , a2 , . . . > sorozatot jelképezi, akkor A(cz) =  is: < a0 , ca1 , c2 a2 , . . . cn an , . . . > sorozatot. Igazak még a következok n

an z , amely az

n≥0

n

n≥0 c an z pedig az

1 2 1 2

A(z)

A(z)

 − A(−z) = a1 z + a3 z3 + · · · + a2n−1 z2n−1 + · · · . 1

= 1 + z + z2 + z3 + · · · =

1.10. példa. Legyen A(z)

1

 + A(−z) = a0 + a2 z2 + · · · + a2n z2n + · · · ,

1

+ z + z + ··· = 2

4

2

A(z)

1

. Ekkor

−z



+ A(−z) =

1

1

2

1

−z

!

1

+

1

=

+z

1 1

− z2

1

− z2

,

2

amely megkapható úgyis, hogy z-t z -tel helyettesítjük A(z)-ben.  u Hasonlóképpen, megkaphatjuk a páratlan kitevoj  tagok összegét:

z

1

+ z3 + z5 + · · · =

2

A(z)

 − A(−z) =

1

1

2

1

−z

!

1



1

+z

=

z

.

A generátorfüggvények segítségével érdekes képleteket kaphatunk. Legyen például A(z)

=

1/(1



z)

=

1

+

z

+

2

z

+

z

3

+ ···.



+

Ekkor zA z(1

z)

=

F(z), vagyis éppen a

 Fibonacci-számok generátorfüggvénye. A fenti képletbol zA z(1 Az

n+1

n+1

z

 + z) = z + z2 (1 + z) + z3 (1 + z)2 + z4 (1 + z)3 + · · · . + 1)-edik Fibonacci-szám, míg a

együtthatója a bal oldalon éppen F n+1 , vagyis az (n

jobb oldali együtthatója, a binomiális képlet alkalmazása után minden tagban

X

−k

n

k

k ≥0

Innen F n+1

=

X

n

−k k

k ≥0

!

! .

b n+2 1 c

=

X

n

−k k

k=0

! .

(1.12)

 Emlékeztetünk, hogy a binomiális képlet általánosítható tetszoleges valós r-re is, vagyis

(1

r

+ z) =

X n≥0

!

r n

n

z

,

amely a binomiális együtthatók generátorfüggvénye. Itt

r n

! a kombináció általánosítása va-

lós r-re, vagyis

r

!

n

       =     

r(r 1, 0,

− 1)(r − 2) . . . (r − n + 1) , n(n − 1) . . . 1

ha n

>0,

ha n

=0, b(n + n−1

1)/2c. Egyszeru  okoskodással ki

 tetszoleges n

2



1 természetes számra.

 o  feladatoknál, itt is a bal és jobb 1 konvenció alapján. Akárcsak az eloz

oldali részfákat vizsgáljuk meg. Ha a bal oldali részfában i csúcs és j levél van, akkor a jobb oldaliban n

( j)

− i − 1 csúcs és k −

(k− j)

j levél van. A bi b

n−i−1

szorzat éppen ezeknek a fáknak a

 rekurzív képletet kapjuk: száma. Összegezve k és j szerint, a következo

(k)

bn

= 2b(k) + n−1

n−2 X k −1 X

( j)

bi b i=1

(k− j) n−i−1

.

(1.18)

j=1

 generátorfüggvényt: Ennek a rekurzív egyenletnek a megoldására használjuk a következo (k)

B

(z)

=

X

(k) n

bn z n≥0

,

ahol k

≥1.

31

1.2. Generátorfüggvények és rekurzív egyenletek

n

Az (1.18) egyenlet mindkét oldalát z -nel megszorozva, majd összeadva az n

=

0, 1,

 kapjuk: 2, . . . értékekre, a következot

X

(k) n bn z

=2

n≥1

X

(k)

b

n−1

 n−2 k−1  X X X  ( j) (k − j)   zn . + bi b n−i−1   

n

z

n≥1

n≥1

i=1

j=1

Az összegezés sorrendjét felcserélve

X

(k) n bn z

=2

n≥1

X

(k)

b

n−1

 n−2  k −1 X X X   ( j) (k− j)   bi bn−i−1 zn . +

n

z

n≥1

j=1 n≥1

 k−1  X  ( j) (k − j)   (z) + z  B (z)B (z) 

Innen (k)

B

(z)

i=1

(k)

= 2zB

j=1

vagy (k)

B

  k−1  X ( j) (k − j)  .  B (z)B (z) (z) = 1 − 2z z

(1.19)

j=1

 lépésre haladva, felírhatjuk a következoket.  Lépésrol (2)

B



z

=

(z)

1

(1)

B

− 2z



2

(3)

B

(z)

=

(z)

=

2z

− 2z)

(1



5z

− 2z)

(1

(1)

(z)

(1)

(z)

B

2

3

(4)

B

2

(z)

B

3

,

3 4

, .

 alakban keresni: Az általános megoldást megpróbáljuk a következo



k−1

(k)

B ahol, amint láttuk, c2

(z)

ck z

=

(1

k−1

− 2z)

(1)

B

(z)

k

,

= 1, c3 = 2, c4 = 5. Az (1.19) képletbe behelyettesítve, a ck

számokra

egy rekurzív összefüggést kapunk:

ck

=

k −1 X

ci ck−i

.

i=1

Ezt szintén a generátorfüggvények segítségével oldjuk meg. Ha k innen c1

=

1. Legyen c0

=

1. Ha C(z)

=

P

n≥0

n

cn z

=

2, akkor c2

– gyelembe véve a generátorfüggvények szorzási képletét – C(z)

− 1 − z = (C(z) − 1)2

2

vagy

C (z)

amelyet C(z)-re nézve megoldunk, és a

C(z)

=

3





1

2

=

c1 c1 , és

a cn számok generátorfüggvénye, akkor

− 4z

− 3C(z) + z + 2 = 0 ,

32

1. Rekurzív egyenletek

 = 1 miatt csak a negatív elojel jó. Sorba fejtés után X −1 2n! 1 3 1 1/2 n − (1 − 4z) = − z 2 2 2 2n − 1 n n≥0 ! ! X X 1 2n n 1 2n n + z = 1+ z . 2(2n − 1) n 2(2n − 1) n n≥0 n≥1

képletet kapjuk, mivel C(0) 3

=

C(z)

2 3

=

2

! ,

Innen

(1)

Mivel bn

1

=

cn

2n

− 1)

2(2n

n

≥1.

n

(1)   hogy B = 2n−1 , ha n ≥ 1, könnyen ellenorizhet o, = z/(1 − 2z). Tehát ! 2k−1 1 2k z (k) . B (z) = 2(2k − 1) k (1 − 2z)2k−1

Mivel azonban 1

=

− z)m

(1

X

!

+m−1

n

z

n

n≥0

n

,

 eredményhez jutunk: a következo

(k)

B

(z)

1

=

2(2k

2k

− 1)

1

=

2(2k

k 2k

− 1)

!X

k

=

1 2k

−1

vagy (k) bn

=

1 2k n

!

k

!

k

!

−1 n − 2k + 1

−1 2k − 2 n

n−2k+1 n

2

z

.

! n−2k

2

!

n 2k

n 2k+n−1

2 z

n

n≥2k−1

2k

!

+n−2 n

0 ! n≥X

Innen pedig (k) bn

2k

−1

2

n−2k

.

1.2.3. A Z-transzformáció módszere Ha generátorfüggvényekkel oldunk meg egy inhomogén lineáris rekurzív egyenletet, akkor, amint láttuk, mindig egy racionális törtfüggvény sorba fejtése adja meg a megoldást. A Z-transzformáció módszerével ezt a sorba fejtést könnyebben elvégezhetjük. Legyen a raci onális törtfüggvény P(z)/ Q(z), ahol P(z) kisebb fokszámú, mint Q(z). Ha ismerjük a nevezo gyökeit, a törtfüggvényt elemi (vagy parciális) törtfüggvények összegére bonthatjuk a hatá  rozatlan együtthatók módszerével. Nézzük meg eloször azt az esetet, amikor a nevezonek  gyökei vannak, és legyenek ezek csak egyszeres (azaz egymástól különbözo) Ekkor felírhatjuk, hogy P(z) Q(z)

=

A1 z

− α1

+ ··· +

Ai z

− αi

+ ··· +

Ak z

− αk

.

α1 , α 2 , . . . , α k .

33

1.2. Generátorfüggvények és rekurzív egyenletek

Könnyen belátható, hogy

Ai

=

 Másfelol

Ai z

ahol

lim (z

z→αi

− αi

− αi )

P(z) Q(z)

,

i

Ai

= −αi



1

1

αi

= 1, 2, . . . , k .

!= z

−Ai βi , 1 − βi z

 kapjuk: βi = 1/αi . Ha most ezt az elemi törtet sorba fejtjük, akkor a következot

−Ai βi = − A i βi 1 − βi z n

Innen a z együtthatója

 + βi z + · · · + βni zn + · · · .

1

−Ai βni +1 , és jelöljük ezt Ci (n)-nel. Ekkor = −Ai βni +1 = −βi

C i (n)

lim (z

z→αi

vagy C i (n) Ha most elvégezzük a z

= −βni +1

(z

lim

− αi )

P(z) Q(z)

− αi )P(z)

z→αi

Q(z)

,

.

→ 1/z átalakítást, és gyelembe vesszük, hogy βi = 1/αi , akkor ! p(z) n−1 C i (n) = lim (z − βi )z , z→βi

ahol

q(z)

p(z)

=

q(z)

P(1/z) Q(1/z)

.

n

Ekkor az X(z) kifejtésében a z együtthatója éppen C 1 (n) Könnyen belátható, hogy ha

α

+ C2 (n) + · · · + Ck (n) . β =

gyöke a Q(z) polinomnak, akkor

1/α gyöke a q(z)

polinomnak. Például, ha z

P(z) Q(z)

=

2z (1

− z)(1 − 2z)

,

p(z)

akkor

Amennyiben egy gyök többszörös, például

βi

q(z)

=

2 (z

− 1)(z − 2)

 részeredp-szeres, akkor a neki megfelelo

mény C i (n)

Itt

d

=

1 (p

lim

− 1)! z→β

i

d

.

p−1

dz p−1

(z

− βi )

p n−1

z

p(z) q(z)

! .

p

f (z) az f (z) függvény p-edrendu  deriváltját jelenti. dz p  algoritmusban összegezhetok.  Az eddigiek a következo Feltesszük, hogy az egyenlet

együtthatóit a A, a megoldás állandóit pedig a C tömb tartalmazza.

34

1. Rekurzív egyenletek

L - ´ ´ (A, k, f ) 1

legyen az egyenlet a0 xn

+ a1 xn+1 + · · · + ak xn+k =

f (n);

n

szorozzuk be az egyenlet mindkét oldalát z -nel és összegezzünk n szerint 2

=

hozzuk az egyenletet X(z)

P(z)/ Q(z) alakra, ahol X(z)

=

P

n≥0

n

xn z

,

P(z) és Q(z) pedig polinomok 3

végezzük el a z

→ 1/z átalakítást, legyen az eredmény

p(z)/q(z), ahol p(z) és q(z) polinomok 4

legyenek q(z) gyökei:

β1 β2

p2 -szeres, p2

≥ 1, ≥ 1,

pk -szeres, pk

≥ 1;

p1 -szeres, p1

...

βk

ekkor az eredeti egyenlet általános megoldása

= C1 (n) + C2 (n) + · · · + Ck (n),  ahol  − d p n−1 C i (n) = 1/(( pi − 1)!) limz→β (z − βi ) z ( p(z)/q(z)) , − dz xn

pi

5

1

pi

i

i

i

1

= 1, 2, . . . , k .

return C A módszer neve onnan ered, hogy ha egy generátorfüggvényben z helyébe 1/z-t helyet-

tesítünk, akkor megkapjuk a Z-transzformáltját, amelyre hasonló muveletek  léteznek, mint a generátorfüggvényekre, és amelyre alkalmazva a reziduum-tételt, a fenti eredményhez jutunk. 1.12. példa. Oldjuk meg az xn+1

− 2xn = 2n+1 − 2,

ha

n

≥ 0,

=0

x0

rekurzív egyenletet. n

z -nel beszorozva és összegezve

X xn+1 z

n

−2

n≥0

azaz

1 z

X(z)

X xn z

− 2X(z) =

2 1

− 2z

X(z)

=

n+1 n

2

n≥0

z



n≥0



2 1

−z

Innen

Az

X

=

n

2z

X 2z

n

,

n≥0

,

ahol X(z)

=

X xn z

n

.

n≥0

2

(1

− z)(1 − 2z)2

(z

− 1)(z − 2)2

.

→ 1/z helyettesítést elvégezve p(z) q(z)

=

2z

,

 gyökei: 1 egyszeres, 2 kétszeres gyök. Ezért ahol a nevezo n

C1

C2

= lim z→2

d dz

2z z

= lim

n

−1

z→1

2z (z

− 2)2

! = 2 lim z→2

nz

=2

n−1

− 1) − zn = 2n (n − 2) . − 1)2

(z

(z

és

35

1.2. Generátorfüggvények és rekurzív egyenletek

Az általános megoldás tehát

= 2n (n − 2) + 2,

xn

n

≥0.

1.13. példa. Oldjuk meg az xn+2

= 2xn+1 − 2xn ,

ha

n

≥ 0,

x0

= 1,

=1

x1

rekurzív egyenletet. n

z -nel beszorozva és összegezve 1

X

z

n+2

xn+2 z

2

2

=



1 z

F(z)

2

xn+1 z

z

n≥0

innen

X

F(z)

1



z2

z

2 z

 gyökei 1 A nevezo

=

z2

X xn z

n

,

n≥0

2

Ekkor F(1/z)

−2

n≥0

 −z =

azaz

n+1

F(z)

− 2F(z) ,

! 1 +2 =− . z

−z . − 2z + 2

+ i és 1 − i. Kiszámítjuk C1 (n)-t és C2 (n)-t:

Mivel 1

+i=

C 1 (n)

=

C 2 (n)

=

√  2 cos

π 4

lim

z→1+i

z

−zn+1 = − (1 − i)

i(1

+ i)n 2

és

−zn+1 −i(1 − i)n = . − (1 + i) 2 √  π π π , 1 − i = 2 cos − i sin ,

lim z→1−i z

+ i sin

4

4

4

hatványozás után (1

+ i)n =

√ n  2

cos

nπ 4

xn

+ i sin

nπ 4

 ,

(1

= C1 (n) + C2 (n) =

− i)n =  √ n 2

√ n 

sin

2

nπ 4

cos

nπ 4

− i sin

nπ 4

 ,

.

Gyakorlatok 1.2-1. Számítsuk ki, hány olyan n csúcsú bináris fa van, amelynek sem a bal, sem pedig a jobb oldali részfája nem üres.  külön1.2-2. Számítsuk ki, hány olyan n csúcsú bináris fa van, amelyben minden levéltol  csúcsnak pontosan két gyereke van. bözo 1.2-3. Oldjuk meg generátorfüggvény segítségével az alábbi rekurzív egyenletet. Hn

= 2Hn−1 + 1,

H0

=0.

(Hn itt a Hanoi-tornyai nevu  feladat lépésszámát jelenti.)

36

1. Rekurzív egyenletek

1.2-4. Oldjuk meg Z-transzformáció segítségével az alábbi rekurzív egyenletet: F n+2

=

F n+1

+ Fn + 1,

ha n

≥ 0,

és

F0

= 0, F 1 = 1 .

 egyenletrendszert: 1.2-5. Oldjuk meg a következo un vn ahol u0

= =

+ un−2 , + un−1 ,

vn−1 un

= 1, u1 = 2, v0 = 1.

1.3. Numerikus megoldás Leírunk egy függvényeljárást, amellyel lineáris rekurzív egyenleteket oldhatunk meg nume formában adjuk meg: rikusan. Az egyenletet a szokásos módon, a következo a0 xn

+ a1 xn+1 + · · · + ak xn+k =

f (n)

.

 Az a0 , a1 , . . . , ak együtthatókat az A, míg az x0 , x1 , . . . , xk−1 kezdoértékeket az X vektor tartalmazza. Hogy kiszámítsuk xn értékét, sorra kiszámítjuk az xk , xk+1 , . . . , xn értékeket,  k elemében (azaz a 0, 1, . . . , k minden alkalommal az X vektor elso

− 1 indexu elemekben)

  o  k értékét. orizve meg a sorozat eloz R´(A, X, k, n, f ) 1 for j 2 3 4 5 6 7 8 9

← k to n ← A[0] · X[0] for i ← 1 to k − 1 do v ← v + A[i] · X[i]  v ← f ( j − k) − v /A[k] if j , n then for i ← 0 to k − 2 do X[i] ← X[i + 1] X[k − 1] ← v

do v

10 return v  xj ( j A 2–5. sorokban kiszámítjuk a következo

 o  k érték = k, k + 1, . . . , n) értékét (az eloz

felhasználásával), ezt az értéket az algoritmusban v jelöli. A 7–9. sorokban, amennyiben  k elemébe. A 10. még nem értük el az n-et, átmásoljuk az utolsó k értéket az X vektor elso sor visszaadja az xn értékét. Könnyen belátható, hogy az algoritmus futási ideje

Gyakorlatok

Θ(kn).

1.3-1. Hány összeadást, kivonást, szorzást, osztást és értékadást végez a R´ algorit adatokkal kiszámítja x1000 értékét? mus, ha az 1.4. példában szereplo

37

1. Feladatok

Feladatok 1-1. Homogén egyenlet megoldhatósága generátorfüggvénnyel  Bizonyítsuk be, hogy tetszoleges homogén lineáris rekurzív egyenlet generátorfüggvénnyel  olyan eset, hogy nem tudjuk alkalmazni a megvaló megoldáskor csak akkor fordulhat elo adott módszert, mivel az X(z)

=

0 egyenlethez jutunk, ha az egyenlet megoldása xn

=

0

minden n-re. 1-2. Komplex gyökök Z-transzformáláskor  Vizsgáljuk meg, mi történik, ha a Z-transzformáció módszere alkalmazásakor a nevezo gyökei komplex számok. A rekurzív egyenlet megoldásának mindig valósnak kell lennie. Biztosítja-e ezt a módszer?

Megjegyzések a fejezethez Elaydi [119], Flajolet és Sedgewick [421], Greene és Knuth [175], valamint Mickens [327] könyve részletesen tárgyalja a rekurzív egyenletek megoldását. Vannak a generátorfüggvényekkel foglalkozó, magyar nyelvu  könyvek is – például Knuth [258], valamint Graham, Knuth és Patashnik [171]. Vilenkin muve  [478] egyszeru  módon tárgyal sok-sok feladatot – a könyv utolsó két fejezete rekurzív egyenletekkel és generátorfüggvényekkel foglalkozik. Lovász [296] kombinatorikai problémákat és feladatokat tartalmazó könyvében is vannak generátorfüggvényekre vonatkozó feladatok.  a levelek megszámolása a bináris A bináris fák megszámolása Knuth [258] könyvébol, fák halmazában, valamint az n csúcsú k levelu  bináris fák megszámolása Kása Zoltán [243]  valók. könyvébol

2. Komputeralgebra

A különféle matematikai számítások elvégzésére képes informatikai eszközök nélkülözhetetlenek a modern tudományban és ipari technológiában. Képesek vagyunk kiszámolni  uveket, bolygók, csillagok pályáját, vezérelni atomerom  egyenletekkel leírni, modellezni a  természet számos törvényét. Ezek a számítások alapvetoen kétfélék lehetnek: numerikusak és szimbolikusak. Ámbár a numerikus számítások nemcsak elemi aritmetikai muveleteket  foglalnak magukban, hanem olyan muveleteket  is, mint matematikai függvények numerikus értékének, polinomok gyökeinek vagy mátrixok sajátértékének meghatározása, ezek a muveletek  alap vetoen számokon értelmezettek, és ezek a számok a legtöbb esetben nem pontosak, pontos ságuk az adott számítógépes architektúra lebegopontos ábrázolási módjától függ. A szim szimbólumokon bolikus számításokat matematikai vagy informatikai objektumokat jelento értelmezzük. Ezek az objektumok lehetnek számok (egészek, racionális számok, valós és komplex számok, algebrai számok), de lehetnek polinomok, racionális és trigonometrikus függvények, egyenletek, egyenletrendszerek, algebrai struktúrák elemei, vagy éppen halmazok, listák, táblázatok. A szimbolikus számítások elvégzésére alkalmas számítógépes rendszereket (amelyek legtöbbször numerikus számításokra és az eredmények grakus megjelenítésére egyaránt képesek) komputeralgebra-rendszereknek vagy szimbolikus-algebrai rendszereknek nevezzük. Az utal.

algebra” szó a szimbolikus objektumokkal végzett muveletek  algebrai eredetére ”

A komputeralgebra-rendszerek mint számítógépes programok alapfeladata: (1) matematikai objektumok szimbolikus ábrázolása, (2) aritmetika ezekkel az objektumokkal. A  hatékony komputeralgebra, mint tudományterület feladata pedig erre az aritmetikára épülo algoritmusok keresése, elemzése és megvalósítása tudományos kutatásokhoz és alkalmazásokhoz.  Mivel a komputeralgebra-rendszerek szimbolikusan, (lényegében) tetszoleges pontos sággal és hibamentesen képesek számolni, eloször tisztázni kell, milyen adatszerkezeteket lehet hozzárendelni a különféle objektumokhoz. A 2.1. alfejezet a matematikai objektumok ábrázolásának problémakörét taglalja. A továbbiakban a szimbolikus algoritmusok közül  folyamán a mindennapi tudomány és technika elengedismertetjük azokat, melyek az idok hetetlen részévé váltak. A természettudományok többsége jelenségeit, gondolatait matematikai egyenletekkel írja le. A lineáris egyenletek, egyenletrendszerek szimbolikus megoldásainak vizsgálata a jól ismert eliminációs módszereken alapul. A nemlineáris egyenletrendszerek megoldásai-

39

2.1. Adatábrázolás

 nak megkeresésére eloször megvizsgáljuk az euklideszi algoritmus különféle változatait és a rezultánsmódszert. A hatvanas évek közepén Buchberger doktori dolgozatában egy hatékony módszert dolgozott ki többváltozós polinomegyenletek szimbolikus megoldásainak meghatározására, amit ma Gröbner-bázis elmélet néven ismerünk. Buchberger munkájára  csak évekkel késobb kezdtek felgyelni, azóta a terület a komputeralgebra egyik legnépsze lesz szó a 2.2. és a 2.3. alfejezetekben. rubb  ága. Ezekrol  bemutatandó terület a szimbolikus integrálás. Habár a probléma formális A következo természete már több, mint 100 éve ismert (Liouville-elmélet), csak 1969-ben tudott Risch hatékonyR algoritmust adni annak eldöntésére, hogy ha adott egy valós elemi f függvény, akkor az

f (x)d x integrál is elemi-e és ha igen, az algoritmus meg is adja az integrál értékét.

A módszerrel a 2.4. alfejezetben foglalkozunk. A fejezet végén áttekintjük a szimbolikus algoritmusok elméleti és gyakorlati vonatkozásait (2.5. alfejezet), külön részt szánva napjaink komputeralgebra-rendszereinek.

2.1. Adatábrázolás  Ahhoz, A komputeralgebrában a legkülönfélébb matematikai objektumok fordulnak elo.  hogy ezekkel az objektumokkal számolni lehessen, ábrázolni és tárolni kell oket a számítógép memóriájában. Ez elméleti és gyakorlati problémák egész sorát veti fel. Ebben az  a kérdésekrol  lesz szó. alfejezetben ezekrol Tekintsük az egészeket. Egyrészt matematikai tanulmányainkból tudjuk, hogy halmazuk  azzal is tisztában vagyunk, megszámlálható számosságú, viszont informatikai szemszögbol hogy számítógépünk csak véges sok egész tárolására képes. Az, hogy mekkora a legnagyobb  egész, amit minden további erofeszítés nélkül ábrázolni tudunk, attól függ, hogy számítógépes architektúránkban mekkora a gépi szó mérete. Ez tipikusan 16, 32, 48 vagy 64 bit. Az egy gépi szóban ábrázolható egészeket egyszeres pontosságú egészeknek nevezzük. Nem  biztos, hogy egy tetszoleges egész szám elfér egy gépi szóban, vagyis olyan adatstruktúrára  van szükség, ami több gépi szó felhasználásával tetszolegesen nagy egész ábrázolására ké pes. Természetesen a tetszolegesen nagy” nem jelent végtelen nagyot”, hiszen valamilyen ” ” tervezési igény vagy a memória mérete mindenképpen korlátot szab. Emellett olyan adatáb rázolást kell megvalósítani, amelyre hatékony muveletek  építhetok. Az egészek reprezentá ciójának alapvetoen két útja van:



helyiértékes (a hagyományos decimális számrendszerbeli ábrázolás általánosítása), amelyben egy n egészet

Pk−1 i= 0

i

di B alakban írunk fel, ahol a B alapszám akármilyen,

egynél nagyobb egész lehet. A hatékonyság növelése miatt B-t úgy érdemes választani, hogy B

{0 ≤

di

− 1 beleférjen egy gépi szóba. A di jegyek (0 ≤ i ≤ k − 1) vagy a kanonikus ≤ B − 1} vagy a szimmetrikus {−b B/2c < di ≤ b B/2c} jegyhalmazból való

egyszeres pontosságú egészek. Az így leírható többszörös pontosságú egészek lineáris listás [d0 , d1 , . . . , dk−1 ] ábrázolásának számítógépes megvalósítása történhet dinamiku san vagy statikusan, attól függoen, hogy a lineáris listát láncolt listaként vagy tömbként implementáljuk.



 számú, egyszeres pontosságú, páronként moduláris, amelyben az n egész megfelelo relatív prím modulusokkal vett moduláris képeinek lineáris listájaként adható meg. A  n a kínai maradéktétel segítségével rekonstruálható. moduláris képekbol

40

2. Komputeralgebra

A moduláris alak gyorsabb az összeadás, kivonás és szorzás muveleteket  tekintve, de lényegesen lassabb például oszthatósági vizsgálatoknál (amelyek sok esetben elkerülhetetlenek).  Nyilvánvaló, hogy az adatstruktúra megválasztása erosen befolyásolja algoritmusaink sebességét. 2.1. példa. Az alábbi példában az egyszeruség  kedvéért természetes számokkal dolgozunk. Tegyük fel, hogy olyan számítógép architektúránk van, ahol a gépi szó 32 bites, vagyis számítógépünk az I1

=

[0, 2

32

− 1] =

[0, 4 294 967 295] intervallum egészeivel képes egész aritmetikát végezni. Erre

az aritmetikára építve az architektúránkon valósítsunk meg olyan egész aritmetikát, amellyel az I2 [0, 10

50

=

] intervallumban is számolni tudunk.

A helyiértékes ábrázoláshoz legyen B

= 104 , továbbá

n1

=

123456789098765432101234567890

n2

=

2110

,

.

Ekkor

=

n1

[7890, 3456, 1012, 5432, 9876, 7890, 3456, 12]

,

n2

=

[2110]

n1

+

n2

=

[0, 3457, 1012, 5432, 9876, 7890, 3456, 12]

,

n1



n2

=

[7900, 3824, 6049, 1733, 9506, 9983, 3824, 6049, 2]

, ,

ahol az összeadást és a szorzást helyiértékesen számoltuk. A moduláris ábrázoláshoz válasszunk páronként relatív prím számokat az I1 intervallumból úgy, hogy szorzatuk nagyobb legyen 10 m1 m4

Q6

mi i=1 tossal ábrázolunk. prímek, ahol

>

50

-nél. Legyenek például

= 4294967291,

10

50

= 4294967279,

m2

= 4294967197,

m5

= 4294967189,

m3 m6

= 4294967231 , = 4294967161

. Egy I2 intervallumbeli egészet tehát az I1 intervallumból vett számha-

Ekkor

valamint n2

n1

≡ 2009436698

(mod m1 ),

n1

≡ 961831343

n1

≡ 4253639097

(mod m3 ),

n1

≡ 1549708

n1

≡ 2459482973

(mod m5 ),

n1

≡ 3373507250

≡ 2110

(mod mi ), (1

(mod m2 )

(mod m4 )

,

,

(mod m6 )

,

≤ i ≤ 6), vagyis

n1

+

n2

=

[2009438808, 961833453, 4253641207, 1551818, 2459485083, 3373509360]

,

n1



n2

=

[778716563, 2239578042, 2991949111, 3269883880, 1188708718, 1339711723]

,

 ahol az összeadás és a szorzás koordinátánként modulárisan elvégezve értendo.

Általánosabban, a matematikai objektumok ábrázolásának három absztrakciós szintjét érdemes megkülönböztetni: 1.

Az objektumok szintje. Ezen a szinten az objektumok formális matematikai objektumok nak tekinthetok. Például 2 + 2, 3 ∗ 3 − 5 és 4 ugyanazt az objektumot jelölik. Hasonlóan, az (x

+

2

1) (x

 tekinthetok.



1) és x

3

+

x

2



x



1 polinomok az objektumok szintjén azonosnak

41

2.1. Adatábrázolás

 ábrázolásait. Például A forma szintje. Itt már megkülönböztetjük az objektumok eltéro

2.

+ 1)2 (x − 1) és

az (x

x

3

+ x2 − x − 1 polinomok ugyanannak a polinomnak különbözo

 reprezentációi, hiszen az elobbi egy szorzat, utóbbi egy összeg.  ábrázolásokat tekintjük Az adatstruktúra szintje. Itt a számítógép memóriájában eltéro

3.

 különbözoknek. Az x

3

+ x2 − x − 1 polinomnak ezen a szinten többféle reprezentációja

is lehet, a polinomot leírhatja például

• •

egy együtthatókból álló tömb: [−1, −1, 1, 1] , egy láncolt lista: [−1, 0]

→ [−1, 1] → [1, 2] → [1, 3]

.

 matematikai objektumok számítógépes ábrázolásához a komputeralgebraA különbözo  rendszerek tervezoinek dönteniük kell mind a forma, mind az adatstruktúra szintjén. A döntést olyan kérdések nehezítik, mint a reprezentáció memóriaigénye, olvashatósága, vagy az ábrázolás számítási ideje. Például az

− 1)2 (x + 1)3 (2x + 3)4 9 8 7 6 5 4 3 2 16x − 80x + 88x + 160x − 359x + x + 390x − 162x − 135x + 81

= =

f (x)

(x

  polinom szorzat alakja kifejezobb, mint az összeg alakja, de utóbbi elonyösebb, ha mond5

juk az x -es tag együtthatójára vagyunk kíváncsiak. A forma szintjére vonatkozó döntési nehézségeket szemlélteti az alábbi példa:



x



1000

(x

− 1 és (x − 1)(x999 + x998 + · · · + x + 1)

+ 1)

1000

és x

1000

+ 1000x

999

,

+ · · · + 1000x + 1

.

 ábrázolására tökéletes módszert A matematikai objektumok minden igényt kielégíto  reprezentációi is megengedetnem ismerünk. A gyakorlatban az objektumoknak különbözo  ábrázolása esetén meg kell tek. Ez azt a problémát veti fel, hogy ugyanazon objektum eltéro  tudnunk állapítani azok egyenloségét, konvertálni kell tudnunk egyik alakból a másikba és az egyértelmu  ábrázoláshoz egyszerusítéseket  kell tudnunk azokon végrehajtani. A forma szintjén például minden egész számot felírhatunk valamely B alapú számrendszerben, míg az adatstruktúra szintjén a forma szintjén kapott lineáris listát láncolt listaként vagy tömbként reprezentálhatjuk.  ol  állnak. Memória A racionális számok egészek párjaiból, a számlálóból és a nevezob takarékosság érdekében, valamint két racionális szám könnyu  összehasonlíthatósága miatt  legnagyobb közös osztójával egyszerusített célszeru  a számláló és a nevezo  alakot ábrázolni. Mivel az egészek euklideszi gyur  ut  alkotnak, a legnagyobb közös osztó euklideszi algorit érdemes pozitívnak mussal gyorsan számolható. Az ábrázolás egyértelmuségéhez  a nevezot   választani, a racionális szám elojele így a számláló elojele lesz. A többváltozós polinomok (az R[x1 , x2 , . . . , xn ] n-változós polinomgyur  u  elemei, ahol R gyur  u)  a1 x x

ei

1

1.

1

x

ei

2

2

e1

ein

. . . xn

+ a2 xe + · · · + an xe 2

n

alakúak, ahol ai

∈ R \ {0}, ei = (ei , . . . , ei 1

e

n

) és x i -t írtunk

 helyett. A forma szintjén az alábbi reprezentációs lehetoségek adódnak.

Kiterjesztett vagy faktorizált ábrázolás, ahol a polinom összegként vagy szorzatként jelenik meg:

• •

− x2 + y − 1 , 2 x + 1 (y − 1) .

x

2

y

42 2.

2. Komputeralgebra

Rekurzív vagy disztributív ábrázolás (csak többváltozós esetben). Például kétváltozós  R[x, y]-belinek, (R[x])[y]-belinek vagy (R[y])[x]polinomgyur  uben  f (x, y) tekintheto belinek:

• • •

+ x2 + xy2 − 1 , 2 2 (x + x)y + x − 1 , 2 2 2 (y + 1)x + y x − 1 . 2

2

x y 2

−1 + 0x + 0x + 0x − 1. A gyakorlatban a többváltozós polinomok

Az adatstruktúra szintjén ritka vagy teljes reprezentáció lehetséges, például a ritka x polinom teljes ábrázolása x

4

3

4

2

 ritka ábrázolása a célravezeto. A

P∞

i=0

i

ai x alakú hatványsorok legegyszerubb  ábrázolása az, ha valamilyen véges ren-

dig adjuk csak meg az együtthatók sorozatát, így lényegében egyváltozós polinomoknak   hatványsorokhoz tekintjük oket. Ezzel a megközelítéssel az a probléma, hogy különbözo  a hatványsort az együtthatói sorozatát tartozhat ugyanaz a reprezentáció. Ezt elkerülendo, generáló függvénnyel szokás leírni. A generáló függvény egy olyan kiszámítható f függvény, amire f (i)

 azt ismerni, = ai . A hatványsorokkal végzett muveletekhez  ekkor elegendo

 hogy hogyan kell az operandusok együtthatóiból eloállítani a muvelet  eredményét repre h hatványsor zentáló sorozat együtthatóit. Például az f és g hatványsorok szorzatát jelölo együtthatóit a hi

=

Pi

k=0

fk gi−k függvény segítségével származtathatjuk. Ekkor a hi együtt-

hatókat csak akkor kell ténylegesen kiszámolni, ha szükség van az értékükre. Ezt a komputeralgebrában is gyakran használt technikát késleltetett kiértékelésnek nevezzük. Mivel a komputeralgebra-rendszerek szimbolikusan számolnak, az algoritmusok muve letigényének vizsgálatán kívül mindig szükség van memóriaigényük vizsgálatára is, hiszen 1

 a memóriaigény befolyásolja a tényleges futási idot. Tekintsünk egyszeru  példaként egy n  álló lineáris egyenletrendszert, ahol minden egyes egész együttismeretlenes, n egyenletbol ható elfér a számítógép

ω

hosszúságú rekeszében. Kizárólag egész aritmetikát és Gaussn−1

eliminációt alkalmazva a redukció eredményeként kapott együtthatók egyenként 2

ω tár-

helyet igényelhetnek. Ha az együtthatók polinomok lennének és polinomaritmetikát használnánk, az eredmény polinomok együtthatóinak mérete, csakúgy mint a fokszámuk, exponenciális növekedést mutatna. A meggyelt exponenciális növekedés ellenére a kapott végeredmény mégis

normális” méretu,  hiszen a Cramer-szabály miatt a megoldások de”  terminánsok hányadosaiként is megkaphatók, amelyek pedig közelítoleg csak nω tárhelyet  igényelnek. Ezt a jelenséget nevezzük köztes számítási tárrobbanásnak. Elofordulása gyakori a komputeralgebra algoritmusokban. 2.2. példa. Egész aritmetikát használva oldjuk meg az alábbi lineáris egyenletrendszert. 37x

+ 22y + 22z

=

1

31x

− 14y − 25z

=

97

,

−11x + 13y + 15z

=

−86 .

,

  sort 31-gyel, a másodiEloször a második egyenlet x változóját elimináljuk. Szorozzuk meg az elso kat

1

 −37-tel és adjuk össze oket. Ha ezt a módszert alkalmazzuk a harmadik egyenlet

x változójának

 mi a RAM-modellnek megfeleloen  A futási idot muveletszámban  mérjük. Ha Turing-gép modellt és konstans

 hosszú gépi szavakat használnánk, akkor ilyen probléma nem merül fel, mert a tár mindig alsó korlátja az idonek.

43

2.1. Adatábrázolás

moduláris

R-beli feladat

-

R/hmi-beli feladat

redukció

közvetlen számítások moduláris számítások

?

?

R-beli

R/hmi-beli



megoldás

megoldás

rekonstrukció

2.1. ábra. A moduláris algoritmusok általános sémája.

eliminációjára, az eredmény az alábbi lesz: 37x

+ 22y + 22z

1200y

=

1

,

+ 1607z

=

−3558 ,

+ 797z

=

−3171 .

723y

Most y eliminálásához a második sort 723-mal, a harmadikat

−1200-zal szorozzuk, majd összeadjuk

 oket. Az eredmény: 37x

+ 22y + 22z

1200y

=

1

,

+ 1607z

=

−3558 ,

205461z

=

1232766

.

Tovább folytatva az eljárást és sorban eliminálva a változókat végül azt kapjuk, hogy

Egyszerusítés  után x

1874311479932400x

=

5622934439797200

246553200y

=

−2712085200 ,

205461z

=

1232766

,

.

= 3, y = −11, z = 6 adódik. Természetesen, ha a számítások közben a legnagyobb

 közös osztókkal egyszerusítünk,  az együtthatók nagysága kevésbé drasztikusan no.

A számítási tárrobbanás elkerülésére moduláris módszerek használatosak: ahelyett, hogy a számításainkat az R struktúra (pl. euklideszi gyur  u)  egészeivel végeznénk, valamely faktorstruktúrában dolgozunk, majd az eredményt

visszatranszformáljuk” R-be (2.1. ”  ábra). A moduláris redukció és a moduláris számítások általában hatékonyan elvégezhetok, a rekonstrukciós lépés pedig valamilyen interpolációs stratégiával történhet. Megjegyezzük, hogy a moduláris algoritmusok nagyon gyakoriak a komputeralgebrában, de nem univerzálisak.

44

2. Komputeralgebra

2.2. Polinomok közös gyökei Legyen R egy integritási tartomány, továbbá legyenek

+ f1 x + · · · + fm−1 xm−1 + fm xm ∈ R[x], fm , 0 , n−1 g0 + g1 x + · · · + gn−1 x + gn xn ∈ R[x], gn , 0

= =

f (x) g(x)

f0

 tetszoleges polinomok, n, m

(2.1) (2.2)

∈ N, n + m > 0. Állapítsuk meg, hogy mi annak a szükséges és

elégséges feltétele, hogy a két polinomnak legyen közös gyöke R-ben.

2.2.1. Klasszikus és b®vített euklideszi algoritmus  Ha T test, akkor T [x] euklideszi gyur  u.  Emlékeztetoül, az R integritási tartományt euklideszi gyur  unek  nevezzük a

ϕ

\ {0} → N euklideszi függvénnyel, ha bármely a, b ∈ R (b , 0) ∈ R, hogy a = qb + r, ahol r = 0 vagy ϕ(r) < ϕ(b), továbbá minden ϕ(ab) ≥ ϕ(a). A q = a quo b elemet hányadosnak, az r = a rem b : R

esetén létezik olyan q, r a, b



R

\ {0}

esetén

elemet maradéknak nevezzük. Ha egy R euklideszi gyur  uben  dolgozunk, azt szeretnénk, ha a legnagyobb közös osztó egyértelmuen  meghatározható lenne. Ehhez az R gyur  u  egység egyetlen elem kivászorzók által meghatározott ekvivalencia-osztályainak mindegyikébol lasztása szükséges. (Például az egészek {0}, {−1, 1}, {−2, 2}, . . . osztályaiból mindig a nemnegatívat választjuk.) Így minden a a

∈ R egyértelmuen  írható fel = unit(a) · normal(a)

alakban, ahol normal(a)-t az a elem normálalakjának nevezzük. Tekintsünk egy T test feletti R

=

∈ R elem normálalakja legyen a megfelelo  = a/ lc(a), ahol lc(a) jelenti az a polinom foegyüttha-

T [x] euklideszi gyur  ut.  Ekkor az a

 normált fopolinom, vagyis normal(a)

tóját. Foglaljuk össze a lényegesebb eseteket:

• •

ha R

= Z, akkor unit(a) =

ha R

=

sgn(a) (a

, 0) és ϕ(a) = normal(a) = | a |,

 = lc(a) (az a polinom foegyütthatója a unit(0) = = a/ lc(a) és ϕ(a) = deg a.

T [x] (T test), akkor unit(a)

megállapodással), normal(a)

1

 Az alábbi algoritmus tetszoleges euklideszi gyur  uben  kiszámítja két elem legnagyobb közös  osztóját. Megjegyezzük, hogy a világ egyik legosibb algoritmusáról van szó, amit Euklidész már i. e. 300 körül ismert. K-E(a, b)

6

← normal(a) ← normal(b) while d , 0 do r ← c c ← d d ← r

7

return normal(c)

1

c

2

d

3 4 5

rem d

Az egészek gyur  ujében  a 4. sor maradék képzése c −bc/d c-t jelenti. Ha R

= T [x], ahol T

test,

akkor a 4. sor maradék képzése az E ´ --´ - ´ ´ (c, d)

45

2.2. Polinomok közös gyökei

iteráció

r

c

d

–

–

18

30

1

18

30

18

2

12

18

12

3

6

12

6

4

0

6

0

(a) K-E(−18, 30) muködése. 

iteráció

r

–

–

1

x

+

− 23 x+ 4

23

4x

2 3

2



c x

38 3

20 3

0 4



17 3 3

x

6

(b) K-E(12x

4

3

+



20

x

13 3 2

d x

2



23 3

x

+

+ 7x − 2 3 38 20 2 4x − x+ 3 3 23 23 − 4 x+ 6 x

14 3

x

3



+ 7x − 2 20 x+ 3 3 23 23 − 4 x+ 6

4x

20

2

3

x



2

38

0

− 68x3 + 52x2 − 92x + 56, −12x3 + 80x2 − 84x + 24) muködése. 

2.2. ábra. A K-E algoritmus muködésének  bemutatása  adatok a bemeno

Z-ben és Q[x]-ben. Az (a) esetben a = −18, b = 30, a, b ∈ Z. A pszeudokód elso két sora a bemeno számok abszolút értékét számolja

 iterációkban számolt r, c és d ki. A harmadik sortól az hatodik sorig tartó ciklus négyszer fut le, a különbözo értékeket mutatja a táblázat. A K-E(−18,30) algoritmus eredményül a 6-ot szolgáltatja. A (b)  paraméterek a esetben a bemeno

=

12x

4

− 68x3 + 52x2 − 92x + 56, b = −12x3 + 80x2 − 84x + 24 ∈ Q[x].

A

 két sora a polinomok normálalakját eredményezi, majd a while ciklus háromszor fut le. Az algoritmus program elso kimenete a normal(c)

= x − 2/3 polinom.

algoritmussal számolható, melynek elemzését az 2.2-1. gyakorlatra hagyjuk. A 2.2. ábra a K-E muködését  mutatja

Z-ben és Q[x]-ben. Megjegyezzük, hogy Z-ben a

program a while ciklusba mindig nemnegatív számokkal lép be, a maradék képzés mindig nemnegatív számot eredményez, így a 7. sorban a normalizálás felesleges.  annak egy bovített  A K-E algoritmus futási idejének vizsgálata elott változatával foglalkozunk. B  ´-E(a, b) 1

(r0 , u0 , v0 )

2

(r1 , u1 , v1 )

3

while r1

4

,0 ← r0 quo r1 r ← r0 − qr1 u ← (u0 − qu1 ) v ← (v0 − qv1 ) (r0 , u0 , v0 ) ← (r1 , u1 , v1 ) (r1 , u1 , v1 ) ← (r, u, v) normal(r0 ), u0 /(unit(a) · unit(r0 )),

do q

5 6 7 8 9 10

← (normal(a), 1, 0) ← (normal(b), 0, 1)

return

Ismert, hogy az R euklideszi gyur  uben  az a, b mas u, v



 · unit(r0 ))

∈ R elemek legnagyobb közös osztója alkal= au + bv alakban. De nem csak egy ilyen  megfelelok, akkor u1 = u0 + bt és v1 = v0 − at is azok

 lnko(a, b) R elemekkel kifejezheto

számpár létezik. Ha ugyanis u0 , v0

v0 /(unit(b)

46

2. Komputeralgebra

minden t

∈ R esetén: au1

+ bv1 = a(u0 + bt) + b(v0 − at) = au0 + bv0 = lnko(a, b) .

A K-E algoritmust úgy egészítettük ki, hogy eredményül ne csak a legna gyobb közös osztót szolgáltassa, hanem az iméntieknek megfeleloen egy konkrét u, v



R

számpárt is megadjon. Legyen a, b



ϕ

R, ahol R euklideszi gyur  u  a

euklideszi függvénnyel. A B  ´-

 két sora kezdeti értékadásainak megfeleloen  E pszeudokód elso az

= u0 a + v0 b

r0

és

= u1 a + v1 b

r1

(2.3)

 egyenletek nyilván teljesülnek. Megmutatjuk, hogy a (2.3) egyenloségek a pszeudokód while ciklusának transzformációira invariánsak. Tegyük fel, hogy a ciklus valamely ite a (2.3) feltételek teljesülnek. Ekkor a pszeudokód 4–5. sora rációjának végrehajtása elott szerint r

= r0 − qr1 = u0 a + v0 b − q(au1 + bv1 ) = a(u0 − qu1 ) + b(v0 − qv1 ) ,

 a 6–7. sorok miatt amibol

= a(u0 − qu1 ) + b(v0 − qv1 ) = au + bv.

r

A 8–9. sorok olyan értékadásokat jelentenek, melyben u0 , v0 felveszi u1 és v1 , majd u1 , v1  a felveszi u és v értékeit, továbbá r0 , r1 felveszi r1 és r értékét. Ezért (2.3) egyenloségei while ciklus kiértékelése után is teljesülnek. Mivel a ciklus újabb és újabb végrehajtásakor

ϕ(r1 ) < ϕ(r0 ),

így a 8–9. sorok értékadásai során keletkezett

{ϕ(ri )}

sorozat a természetes

 sorozatát alkotja, ezért a vezérlés elobb  számok szigorúan monoton csökkeno utóbb kilép a while ciklusból. A legnagyobb közös osztó az algoritmus maradékos osztás sorozatának  utolsó nem nulla maradéka, a 8–9. soroknak megfeleloen r0 . 2.3. példa. Vizsgáljuk meg a B  ´-E algoritmus maradéksorozatát az a(x)

=

63x

+ 57x4 − 59x3 + 45x2 − 8 ,

b(x)

=

−77x + 66x + 54x − 5x + 99

5

4

3

(2.4)

2

(2.5)

polinomok esetében:

r0

=

r1

=

r2

=

r3

=

r4

=

r5

=

x x

5

4

+ −

19 21 6 7

6185 4851

x

x 3

x 3

4



77

x

539

420796475

x

2

3

+

+

+

2

1016

771300096



x

63

54



+

59

x

2

5 7 5

77

+

x

2

x





1894 1617

8 63

9 7 x

224465568 420796475

125209969836038125 113868312759339264

x



,

, + x

943

,

441

+

100658427 38254225

,

3541728593586625 101216278008301568

471758016363569992743605121 180322986033315115805436875

.

,

47

2.2. Polinomok közös gyökei

 az u0 , v0 változók értékei: Az pszeudokód 10. sorának végrehajtása elott

u0

113868312759339264

=

125209969836038125

− v0

=

− + −

x

3

66263905285897833785656224



81964993651506870820653125

1722144452624036901282056661

x

901614930166575579027184375 113868312759339264 125209969836038125

x



4

+

x

2

1451757987487069224981678954 901614930166575579027184375

65069381608111838878813536 81964993651506870820653125

178270505434627626751446079 81964993651506870820653125 179818001183413133012445617 81964993651506870820653125

x

2

+

x

,

3

6380859223051295426146353 81964993651506870820653125

x

.

A visszatérési értékek:

lnko(a, b)

=

u

=

1, 2580775248128 467729710968369

− v

=

3

27102209423483 2338648554841845 703847794944

155909903656123



x

x

4

25249752472633 2338648554841845

3823697946464



779549518280615

+

x

+ x

2

x

2

7615669511954 779549518280615 3072083769824

779549518280615



x

,

3

301255883677 779549518280615

x

+

25468935587159 2338648554841845

.

 Láthatjuk, hogy az együtthatók drasztikus növekedést mutatnak. Felvetodik a kérdés: miért nem normalizálunk a while ciklus minden iterációjában? Ez az ötlet vezet el a polinomok euklideszi algoritmusa normalizált változatához. B  ´-E- ´ (a, b) 1 2 3 4 5 6 7 8 9 10 11 12 13 14

← unit(a) ← (normal(a), e−0 1 , 0) e1 ← unit(b) −1 (r1 , u1 , v1 ) ← (normal(b), 0, e1 ) while r1 , 0 do q ← r0 quo r1 s ← r0 rem r1 e ← unit(s) r ← normal(s) u ← (u0 − qu1 )/e v ← (v0 − qv1 )/e (r0 , u0 , v0 ) ← (r1 , u1 , v1 ) (r1 , u1 , v1 ) ← (r, u, v)  return r0 , u0 , v0 e0

(r0 , u0 , v0 )

48

2. Komputeralgebra

2.4. példa. Nézzük meg a B algoritmus során keletkezett maradékso ´-E- ´ rozatot és az e együtthatósorozatot a korábbi (2.4), (2.5) polinomokra: r0

=

x

5

r1

=

x

4

r2

=

x

3

r3

=

x

2

r4

=

x

r5

=

1,

19

+

21 6



7

4

3



9144

+

6185

x

59 63

54 77 2

x

8034376

5

+

x

3

2

+

7 5

77

5682

+

2338183

+

+

x



x

6185

x

+

166651173 5236962760

x

x

2

x

8



,

63

9

− ,

+

7

10373 6185

369080899 257100032

,

,

,

e0

=63 ,

e1

= − 77 ,

e2

=

e3

=

e4

=−

e5

=

A pszeudokód 14. sorának végrehajtásakor az lnko(a, b) lnko(a, b)

=

u

=

2580775248128 467729710968369

=

x

3

27102209423483 2338648554841845 703847794944

155909903656123



Q[x]-ben

4851

,

771300096 420796475

,

222685475860375 258204790837504

,

156579848512133360531 109703115798507270400

= r0 , u = u0 , v = v0

.

változók értékei:

1,

− v

6185

x

4

25249752472633 2338648554841845

3823697946464



779549518280615

+

x

+ x

2

7615669511954 779549518280615 3072083769824

779549518280615

2

x



x

,

3

301255883677 779549518280615

x

+

25468935587159 2338648554841845

.

az együtthatók nagyságát tekintve az euklideszi algoritmus normalizált változa-

  de az együtthatók növekedését így sem kerültük el. A B tának elonye szembetun  o,  ´ leírásához, elemzéséhez beveE- algoritmus gépi architektúra függo ´ zetjük az alábbi jelölést. Legyen

λ(a) λ(a)

= blog2 |a|/wc + 1, = max{λ(b), λ(c)},

λ(a)

=

∈ Z \ {0}, és λ(0) = 0 , ha a = b/c ∈ Q, b, c ∈ Z, lnko(b, c) = 1 , X ha a

max{λ(b), λ(a0 ), . . . , λ(an )}, ha a

=

ai x

i

/b ∈ Q[x] ,

0≤i≤n

ai

∈ Z,

b

∈ N+ ,

lnko(b, a0 , . . . , an )

=1,

ahol w a számítógépes architektúra szóhossza bitekben. Könnyu  meggondolni, hogy ha a, b

∈ Z[x] és c, d ∈ Q, akkor λ(c + d) λ(a + b) λ(cd), λ(c/d) λ(ab)

≤ λ(c) + λ(d) + 1 , ≤ max{λ(a), λ(b)} + 1 , ≤ λ(c) + λ(d) , ≤ λ(a) + λ(b) + λ(min{deg a, deg b} + 1) .

Az alábbi tételeket bizonyítás nélkül közöljük. 2.1. tétel. Ha a, b

∈ Z és λ(a) = m ≥ n = λ(b), akkor a K-E és a B  ´-

E algoritmusok O(mn) gépi szóban mért elemi aritmetikai muveletet  igényelnek.

49

2.2. Polinomok közös gyökei

2.2. tétel. Ha F test, a, b, ∈ F[x], deg(a)

= m ≥ n = deg(b), akkor a K-E,

a B algoritmusok O(mn) F-beli  ´-E és a B  ´-E- ´ elemi aritmetikai muveletet  igényelnek. Vajon az együtthatók imént látott növekedése pusztán csak a példaválasztásból fakad? Vizsgáljunk meg a B algoritmusban egyetlen maradékos osztást.  ´-E-N ´ Legyen a

= bq + e∗ r, ahol

a

b

r

= =

x

x

m

n

1

+

c 1

+

d

m−1 X

i

∈ Q[x] ,

i

∈ Q[x] ,

ai x i=0 n−1 X

bi x i=0

∗ +  ∈ Q[x] fopolinomok, ai , bi ∈ Z, e ∈ Q, c, d ∈ N , és tekintsük az n = m − 1 esetet. Ekkor q

λ(q) ∗

e r

λ(e∗ r)

=

x

+

am−1 d

≤ λ(a) + =

a

− bn−1 c

cd λ(b) + 1

− qb =

acd

2

,

, − xbcd2 − (am−1 d − bn−1 c)bd

≤ λ(a) + 2λ(b) + 3 .

cd 2

, (2.6)

Vegyük észre, hogy a (2.6) becslés az r maradék polinom együtthatóira is érvényes, vagyis

λ(r) ≤ λ(a) + 2λ(b) + 3.

Így

λ(a) ∼ λ(b)

esetén maradékos osztásonként az együtthatók

 mérete legfeljebb kb. háromszorosára nohet. Pszeudovéletlen polinomokra a becslés élesnek tunik,  a kísérletezni vágyó Olvasónak ajánljuk a 2-1. feladatot. A legrosszabb esetre kapott becslés azt sejteti, hogy

λ(rl ) = O(3l · max{λ(a), λ(b)}), ahol l jelöli a B algoritmus futási idejét, vagyis lényegében  ´-E-N ´ azt, hogy a while ciklus hányszor hajtódik végre. Szerencsére, ez az exponenciális növekedés nem teljesül az algoritmus minden iterációjában, végeredményben pedig az együtthatók  növekedése a bemenet függvényében polinomiálisan korlátos. A késobbiekben látni fogjuk,  hogy moduláris technika alkalmazásával az együtthatók növekedése teljesen elkerülheto. Összefoglalva, az euklideszi algoritmus segítségével az f , g



R[x] (R test) polinomok

legnagyobb közös osztóját kiszámítva f -nek és g-nek pontosan akkor van közös gyöke, ha a legnagyobb közös osztójuk nem konstans. Ha ugyanis lnko( f , g)

= d ∈ R[x] nem konstans,

akkor d gyökei f -nek és g-nek is gyökei, hiszen d osztója f -nek és g-nek is. Megfordítva, ha f -nek és g-nek van közös gyöke, akkor a legnagyobb közös osztójuk nem lehet konstans, mert a közös gyök ennek is gyöke.

2.2.2. Primitív euklideszi algoritmus Amennyiben R euklideszi gyur  u  vagy alaptételes gyur  u  (amelyben érvényes a számelmélet  állítás, miszerint bármely nem nulla és nem egység elem sorrendalaptételének megfelelo  és egységszorzóktól eltekintve egyértelmuen tol  bontható irreducibilis elemek szorzatára), akkor a helyzet bonyolultabb, hiszen R[x]-ben nem feltétlenül létezik euklideszi algoritmus. Szerencsére, mégis több módszer kínálkozik, melyek használhatóságának két oka van:

50

2. Komputeralgebra

(1) R[x] alaptételes gyur  u,  (2) alaptételes gyur  uben  két vagy több elem legnagyobb közös osztója mindig létezik.  kínálkozó módszer az, hogy a legnagyobb közös osztó számítását R hányaAz elso dostestében végezzük el. A p(x)

∈ R[x] polinomot primitív polinomnak nevezzük, ha nincs

olyan R-beli prím, ami p(x) összes együtthatóját osztaná. Gauss híres lemmája szerint primitív polinomok szorzata is primitív, melynek következménye, hogy f , g primitív polinomok

= lnko( f , g) ∈ R[x], ha d = lnko( f , g) ∈

esetén pontosan akkor lesz d

H[x], ahol H jelöli R

 H[x]hányadostestét. Vagyis az R[x]-beli legnagyobb közös osztó számítás visszavezetheto belire. Sajnos, ez a megközelítés nem igazán hatékony, mert a H hányadostestben használt aritmetika lényegesen költségesebb, mint az R-beli.  Második lehetoségként egy, az euklideszi algoritmushoz hasonló algoritmus segíthet: integritási tartomány feletti egyhatározatlanú polinomgyur  uben  ún. pszeudo-maradékos osztást lehet deniálni. A (2.1), (2.2) polinomokat használva ha m q, r

≥ n, akkor létezik olyan

∈ R[x], hogy m−n+1

gn

ahol r

f

= gq + r ,

= 0 vagy deg r < deg g. A q polinomot az

f és g polinomok pszeudo-hányadosának,

az r polinomot pszeudo-maradékának nevezzük. Jelölésben q

= pquo( f , g), r = prem( f , g).

2.5. példa. Legyen

Ekkor pquo( f , g)

f (x)

=

12x

g(x)

=

−12x3 + 80x2 − 84x + 24 ∈ Z[x] .

= −144(x + 1),

4

− 68x3 + 52x2 − 92x + 56 ∈ Z[x] ,

prem( f , g)

(2.7) (2.8)

= 1152(6x2 − 19x + 10).

Másrészt egységszorzótól eltekintve minden f (x)



R[x] polinom egyértelmuen  írható

fel

f (x)

alakban, ahol cont( f )



R és pp( f )



= cont( f ) · pp( f )

R[x] primitív polinom. Ekkor cont( f )-et f összetevo

jének, pp( f )-et az f (x) polinom primitív részének nevezzük. A felírások egyértelmusége  az  el. Például egységek normalizálásával érheto

Z-ben az egységek {−1, 1} halmazából mindig

a pozitívat választjuk. Az alábbi algoritmus pszeudo-maradékos osztások sorozatát hajtja végre. Az algoritmus felhasználja a pszeudo-maradékot kiszámító prem() függvényt, feltételezi az R-beli  legnagyobb közös osztó, valamint az R[x]-beli polinomok összetevojének és primitív részének kiszámíthatóságát. Bemenete az a, b algoritmus eredménye a lnko(a, b)

∈ R[x] polinomok, ∈ R[x] polinom.

ahol R alaptételes gyur  u.  Az

51

2.2. Polinomok közös gyökei

iteráció

r

–

–

1

108x

2

2

c 3x

4

− 342x + 108 − 414

621x

3

0

d

− 17x3 + 13x2 − 23x + 14 −3x3 + 20x2 − 21x + 6 2 6x − 19x + 10 3x − 2

−3x3 + 20x2 − 21x + 6 2 6x − 19x + 10 3x − 2 0

2.3. ábra. A P´-E algoritmus muködésének  bemutatása az a(x) 56, b(x)

= 12x4 − 68x3 + 52x2 − 92x + = −12x3 + 80x2 − 84x + 24 ∈ Z[x] bemeno adatok esetén. A program elso két sora a bemeneti polinomok

 iteráciprimitív részét számolja ki. A harmadik sortól a hatodik sorig tartó ciklus háromszor fut le, a különbözo ókban számolt r, c és d értékeket mutatja a táblázat. A program 7. sorában a P´-E(a, b) algoritmus eredményül 4

γ

változó értéke lnko(4, 4)

=

4. A

· (3x − 2)-t szolgáltat.

P´-E(a, b) 1 2 3 4 5 6 7 8 9

← pp( f ) ← pp(g) while d , 0 do r ← prem(c, d) c ← d d ← pp(r) γ ← lnko(cont(a), cont(b)) δ ← γc return δ c

d

Az algoritmus muködését  a 2.3. ábra szemlélteti. A P´-E algoritmus futási idejének nagyságrendje megegyezik az euklideszi algoritmus korábban látott változatainak futási idejével. P´-E algoritmus azért nagyon lényeges, mert az R test feletti többváltozós R[x1 , x2 , . . . xt ] polinomgyur  u  alaptételes gyur  u,  így az algoritmust úgy alkalmazzuk, hogy kiszámoljuk a legnagyobb közös osztót mondjuk R[x2

. . . , xt ][x1 ]-ben, majd rekurzí-

van az R[x3 , . . . , xt ], . . . , R[xt ] alaptételes gyur  ukben.  Vagyis a többváltozós polinomgyur  uk  rekurzív szemlélete természetes módon vezet a P´-E algoritmus rekurzív alkalmazásához. Észrevehetjük, hogy az algoritmus a korábban látottakhoz hasonlóan együttható növekedést mutat. Vizsgáljuk meg részletesebben a

Z[x]

alaptételes gyur  ut.  A legnagyobb közös osztó

együtthatóinak nagyságára vonatkozó becslést az alábbi, bizonyítás nélkül közölt tétel mutatja.

=

2.3. tétel (Landau–Mignotte). Legyen a(x) bn , továbbá b(x)

Pm

| a(x). Ekkor n X

i=1

|bi | ≤ 2

n

i=0

i

ai x , b(x)

v tX m bn 2 ai . am

i=0

=

Pn

i=0

bi x

i

∈ Z[x], am ,

0

,

52

2. Komputeralgebra

2.4. következmény. Az eloz  o  tétel jelöléseivel az lnko(a, b)

∈ Z[x] polinom bármely együtt-

hatója abszolút értékben kisebb, mint

min{m,n}

2

 · lnko(am , bn ) · min

v t m X

1

2

|am |

ai i=1

,

1

|bn |

v t n X

 2

bi

.

i= 1

Bizonyítás. Az a és b polinomok legnagyobb közös osztója nyilván osztja a-t és b-t, a foka pedig legfeljebb az a és b polinomok fokainak minimuma. Továbbá a legnagyobb közös  osztó foegyütthatója osztója am -nek és bn -nek is, így lnko(am , bn )-nek is.

2.6. példa. A 2.4. következmény szerint a (2.4), (2.5) polinomok legnagyobb közös osztója bármely együtthatójának abszolút értéke legfeljebb pedig legfeljebb b32



886c

b32/9



3197c

=

201, a (2.7), (2.8) polinomok esetében

= 952.

2.2.3. A rezultáns  módszer a legáltalánosabb keretek között tárgyalja az (2.1), Az alábbiakban ismertetendo  (2.2) polinomok közös gyökeire vonatkozó szükséges és elégséges feltételeket. További elonye, hogy magasabb fokú algebrai egyenletrendszerek megoldására is alkalmazható. Legyen tehát R egy integritási tartomány és H a hányadosteste. Tekintsük H-nak azt a  legszukebb  K bovítését, melyben a (2.1)-beli f (x) polinom és a (2.2)-beli g(x) polinom is

α1 , α2 , . . . , αm -nel, a β1 , β2 , . . . , βn -nel. Készítsük el a következo szorzatot:

lineáris faktorokra bomlik. Jelöljük az f (x) polinom (K-beli) gyökeit g(x) polinom gyökeit pedig

res( f , g)

n

=

m

fm gn (α1

− β1 )(α1 − β2 ) · · · (α1 − βn ) ·(α2 − β1 )(α2 − β2 ) · · · (α2 − βn ) .. . ·(αm − β1 )(αm − β2 ) · · · (αm − βn ) m Y n Y = fmn gm (αi − β j ) . n i=1

j=1

Nyilvánvaló, hogy res( f , g) akkor és csak akkor lesz 0, ha valamilyen i-re és j-re

αi = β j ,

azaz ha f -nek és g-nek van közös gyöke. Ezt a res( f , g) szorzatot az f és g polinomok rezultánsának nevezzük. Vegyük észre, hogy a rezultáns értéke függ az f és g polinomok  azonban a különbözo  sorrendben képzett rezultánsok legfeljebb csak elojelben  sorrendjétol, térhetnek el egymástól:

res(g, f )

=

m

n

n Y m Y

gn fm j=1

=

(−1)

mn

n

(β j

− αi )

i=1 m

m Y n Y

(αi

fm gn

i=1

j=1

− β j ) = (−1)mn res( f , g) .

53

2.2. Polinomok közös gyökei

A rezultánsnak ez az alakja a gyakorlatban természetesen használhatatlan, mivel a gyö alakjait. Mivel kök ismeretét tételezi fel. Vizsgáljuk meg tehát a rezultáns különbözo f (x)

=

fm (x

− α1 )(x − α2 ) · · · (x − αm )

g(x)

=

gn (x

− β1 )(x − β2 ) · · · (x − βn )

( fm (gn

, 0) ,

, 0) ,

ezért g(αi )

=

gn (αi

− β1 )(αi − β2 ) · · · (αi − βn ) n Y gn (αi − β j ) .

=

j=1

Így res( f , g)

n

=

m  Y

fm

n Y

i= 1 n

=

(αi

gn

 − β j)

j=1

m Y

fm

g(αi )

= (−1)mn gm n

i= 1

n Y

f (β j )

.

j=1

Ámbár ez az alak sokkal barátságosabb, még mindig feltételezi legalább az egyik polinom gyökeinek ismeretét. Az alábbiakban azt nézzük meg, hogyan lehetne a rezultánst pusztán csak a polinomok együtthatói segítségével kifejezni. Ez a vizsgálat vezet el a rezultáns Sylvester-féle alakjához. Tegyük fel, hogy a (2.1)-beli f és a (2.2)-beli g polinomoknak van közös gyöke. Ez azt jelenti, hogy van olyan

α∈

f (α)

K szám, amelyre

= =

g(α)

+ fm−1 αm−1 + · · · + f1 α + f0 = 0 , n−1 gn α + gn−1 α + · · · + g1 α + g0 = 0 . m

fm α

n

A két egyenletet szorozzuk meg rendre az

αn−1 , αn−2 , . . . , α, 1, illetve az αm−1 , αm−2 , . . . , α, 1

 egyenletbol  n, a második egyenletbol  m újabb egyenletet nyerünk. számokkal. Ekkor az elso Ezt az m + n egyenletet fogjuk úgy fel, mint egy m + n ismeretlenre vonatkozó homogén lineáris egyenletrendszert, melynek

αm+n−1 , αm+n−2 , . . . , α, 1 a megoldása. A megoldás nyilván

nem-triviális, hiszen 1 is a gyökök között szerepel. Ismert, hogy az olyan homogén lineáris  áll, mint ahány ismeretlent tartalmaz, egyenletrendszernek, amely ugyanannyi egyenletbol csak abban az esetben van nemtriviális megoldása, ha a rendszer determinánsa zérus. Vagyis arra jutottunk, hogy f -nek és g-nek csak akkor lehet közös gyöke, ha a fm

D

=

gn

··· ··· .. .

···

fm

···

···

g0

··· .. .

..

f0

↑ ..

. ··· ··· ..

n f0

.

↓ ↑ m

..

. gn

···

. ···

g0



(2.9)

54

2. Komputeralgebra

determináns nulla (a ki nem írt és nem pontozott helyeken mindenütt nullák állnak). A közös gyök létezésének tehát szükséges feltétele, hogy az (m + n)-edrendu  D determináns 0 legyen. Az alábbiakban bebizonyítjuk, hogy a D determináns megegyezik az f és g polinomok

=

 az következik, hogy D rezultánsával, amibol

0 a közös gyökök létezésének elégséges

feltétele is. A (2.9) determinánst nevezzük az f és g polinomok rezultánsa Sylvester-féle alakjának. 2.5. tétel. A korábbi jelölésekkel

D

=

m Y

n

fm

g(αi )

.

i=1

Bizonyítás. m-re vonatkozó teljes indukcióval dolgozunk. m

= 0-ra

f

=

fm

=

f0 , így a jobb

n 0

 oldal f . A bal oldalon D egy n-edrendu  determináns, melynek a foátlójában csupa f0 áll, a többi helyen pedig nulla. Így D m

=

n 0

f , az állítás tehát igaz. A továbbiakban tegyük fel, hogy

> 0 és hogy a bizonyítandó állítás n − 1-re igaz. Ha tehát ∗

f (x)

=

fm (x

− α1 ) · · · (x − αm−1 ) =



fm−1 x

m−1

f helyett az



+

fm−2 x

m−2

+ ··· +



f1 x

+



polinomot vesszük, akkor f ra és g-re az állítás teljesül:



··· .. .

fm−1

∗ D



···

···

g0

..



···

fm−1

··· .. .

gn

=

···

f0

··· ..

=



− αm ), ezért

fm

=

f (x



fm−1 , fm−1

f és f



=



fm−2

. ···



f0

=

∗m

m−1 Y

fm−1

g(αi )

.

i= 1

. ..

. ···

gn Mivel f

..

. ···

g0

együtthatói között az





fm−1 αm , . . . , f1

=



f0





f1 αm , f0

= − f0∗ αm

összefüggések állnak fenn. Így



fm−1

D

=

gn



fm−2

− fm∗−1 αm .. . ··· .. .

···

· · · − f0∗ αm



···

···

g0

fm−1

..

··· ..

..

. ···

− f0∗ αm .

. ..

. gn

···

. ···

g0



f0

55

2.2. Polinomok közös gyökei

  oszlop A determinánst a következoképpen alakítjuk át: az elso a második oszlophoz, az új második oszlop

αm -szeresét

 n sorból eltunnek valamennyi oszlopon. Ezáltal az elso  az



 n sora megegyezik a fenti D elso ki a második

αm -szeresét hozzáadjuk

a harmadik oszlophoz stb., végig

αm -ek,

vagyis az átalakított D

 n sorával. Az utolsó m sorban az elsob  ol  vonjuk elso

 a rákövetkezo  αm -szeresét. Végül αm -szeresét, majd hasonlóan mindegyikbol

 az alábbi determináns lesz: D-bol



fm−1

D

··· ∗

···

···

g0

..



···

fm−1

··· .. .

gn

=

··· .. .

f0

..

=

feltevés alapján D

i=1

.

.

··· gn

Qm



f0

..

gn

n fm

. ···

···

.

Az utolsó oszlop szerint kifejtve, a D

..

=

. ··· gn αm + gn−1

g0

···

g(αm )



  az indukciós D g(αm ) egyenloséghez jutunk, amibol

g(αi ) következik.

Azt kaptuk tehát, hogy D

=

res( f , g), vagyis az f és g polinomoknak akkor és csak

akkor van közös gyökük K-ban, ha a D determináns eltunik.  Algoritmikus szempontból magasabb fokú polinomok esetén a rezultáns Sylvester-féle alakjának kiszámolása egy nagy determináns kiszámítását jelenti. Az alábbi tétel szerint a pszeudo-maradékos osztás egyszerusítheti  a számításokat. 2.6. tétel. A (2.1)-beli f és (2.2)-beli g polinomokra m

        

res( f , g)

= 0,

(m−n)(n−1)+d

gn

≥ n > 0 esetén

ha prem( f , g)

res( f , g)

= (−1)mn res(g, r),

ha r

=0,

= prem( f , g) , 0és d = deg(r) . m−n+1

 sorát szorozzuk meg gn Bizonyítás. A (2.9) determináns elso qm−n x

m−n

+ · · · + q0 ∈

R[x] és r

=

rd x

d

+ · · · + r0 ∈

-gyel. Legyenek q

=

R[x] azok az egyértelmuen  megha-

tározott polinomok, melyekre m−n+1

gn

( fm x

m

+ ··· +

f0 )

=

(qm−n x

m−n

+ · · · + q0 )(gn xn + · · · + g0 )

+ rd x d + · · · + r0 , ahol r

=

prem( f , g). Ekkor a rezultáns (n

+ 1)-edik

sorát qm−n -nel, az (n

 sorból kivonva a qm−n−1 -gyel stb. szorozva, majd az elso

+ 2)-edik

sorát

56

2. Komputeralgebra

m−n+1 gn res( f , g) =

0

gn

···

0

rd

fm

··· .. .

···

··· .. .

··· ..

fm

···

···

g0

f0

..

. ···

f0

. ..

. ..

. ..

..

··· ··· ···

. ..

. ..

. gn

 sor (m determinánst kapjuk. Itt rd az elso (m

· · · · · · r0 ··· ··· ···

···

···

. ···

g0



− d + 1)-edik oszlopában van, r0 pedig az elso sor

+ 1)-edik oszlopában. m−n+1

Hasonló módon folytatva szorozzuk meg a második sort gn meg az (n

+ 2)-edik,

(n

+ 3)-adik, . . .

második sorból. Ugyanígy a harmadik,

n(m−n+1) gn res( f , g) =

. . ., n-edik sorra. Az eredmény:

rd

··· .. .

··· ..

r0

··· .. .

··· ..

···

g0

..

..

..

···

. ···

r0

. ..

. ..

.

.

. ..

..

. rd

gn

-gyel, majd szorozzuk

 sort qm−n -nel, qm−n−1 -gyel stb., és vonjuk ki oket a

. ..

. gn

···

···

. ···

g0

.

57

2.2. Polinomok közös gyökei

Sorcserék után azt kapjuk, hogy

n(m−n+1) mn gn res( f , g) = (−1)

··· .. .

gn

··· ..

···

g0

..

. ..

. gn

rd

··· .. . ··· .. .

···

. ···

g0

..

gn

. ··· ··· ···

···

r0

..

..

g0

. ..

. rd

···

. ···

r0

.

Vegyük észre, hogy

ezért

··· .. .

gn

··· .. .

rd

···

···

gn

···

···

r0

..

n(m−n+1)

 amibol

··· ..

(m−n)(n−1)+d

. ···

g0

..

···

res( f , g)

gn

..

.

. rd

gn

g0

. ···

r0

= res(g, r) ,

−d = (−1)mn gm res(g, r) , n

res( f , g)

= (−1)mn res(g, r)

(2.10)

következik.

A (2.10) egyenlet egy nagyon fontos kapcsolatot ír le. Ahelyett, hogy az esetleg óriási méretu  res( f , g) determinánst számítanánk ki, pszeudo-maradékos osztások sorozatát végezzük el, majd minden lépésnél (2.10)-et alkalmazzuk. Csak akkor számoljuk ki a rezultánst,  el. A tétel fontos következménye az ha már több pszeudo-maradékos osztás nem végezheto alábbi 2.7. következmény. Léteznek olyan u, v deg u

< deg g, deg v < deg

∈ R[x] polinomok, melyre res( f , g) =

fu

+ gv, ahol

f.

Bizonyítás. A rezultáns determináns alakjában az i-edik oszlopot szorozzuk meg x és adjuk az utolsó oszlophoz minden i

m+n−i

-vel

= 1, . . . , (m + n − 1)-re. Az eredmény az alábbi lesz:

58

2. Komputeralgebra

res( f , g) =

fm

··· .. .

··· fm

···

gn

··· .. .

···

g0

f0

···

gn

··· .. . ··· ··· .. .

x

n−1

f

.. .

f x

m−1

···

g

.. .

g

.

A determinánst az utolsó oszlopa szerint kifejtve, majd f -et és g-t kiemelve kapjuk az állí egyenloséget  tásban szereplo a fokokra vonatkozó megszorításokkal.

 A rezultánsmódszer legfontosabb elonye a korábban látott módszerekhez képest, hogy a bemeneti polinomok szimbolikus együtthatókat is tartalmazhatnak. 2.7. példa. Legyen

Ekkor f és g

Q-beli

f (x)

=

g(x)

=

2x x

2

3

− ξ x2 + x + 3 ∈ Q[x] ,

− 5x + 6 ∈ Q[x] .

közös gyökeinek létezését az euklideszi algoritmus variánsai segítségével nem

tudjuk eldönteni, míg a rezultánsmódszerrel igen: pontosan akkor van közös gyök, ha

res( f , g) = vagyis ha

2

−ξ

1

3

2

−ξ

1

1

−5

6

1

−5

6

1

−5

2 = 36ξ − 429ξ + 1260 = 3(4ξ − 21)(3ξ − 20) = 0 ,

3

6

ξ = 20/3, vagy ξ = 21/4.

 A rezultáns jelentosége nemcsak abban áll, hogy segítségével két polinom közös gyö hanem abban is, hogy használatával algebrai egyenletrendszerek kének létezése eldöntheto,  egyismeretlenes algebrai egyenletek megoldására. rekurzív módon visszavezethetok 2.8. példa. Legyen f (x, y)

=

g(x, y)

=

x

2

+ xy + 2x + y − 1 ∈ Z[x, y] ,

(2.11)

x

2

+ 3x − y + 2y − 1 ∈ Z[x, y] .

(2.12)

2

Értelmezzük az f és g polinomokat úgy, mint (Z[x])[y]-beli elemeket. Pontosan akkor létezik közös gyökük, ha

resy ( f , g) = Z-beli

x

+1 0

−1

közös gyökök tehát az x

x

2

+ 2x − 1 x+1 2

∈ {−3, 0, 1}

0 x

2

x

2

+ 2x − 1 + 3x − 1

= − x3 − 2x2 + 3x = 0 .

esetben létezhetnek. Minden x-hez (immáron

Z[y]-ban)

visszahelyettesítéssel megoldjuk a (2.11), (2.12) egyenleteket, amikor is azt kapjuk, hogy az egyenletek egész megoldásai a (−3, 1), (0, 1), (1, −1) számpárok.

59

2.2. Polinomok közös gyökei

Megjegyezzük, hogy a rezultánsmódszer többváltozós polinomegyenlet-rendszerek megoldásainak megkeresésére is alkalmas, ámbár nem igazán hatékony. Az egyik probléma az, hogy a determináns kiszámítása során számítási tárrobbanás lép fel. Meggyelhetjük, hogy az egyhatározatlanú m és n-edfokú polinomok rezultánsa determináns alakjának kiszámítása a szokásos Gauss-eliminációval O((m + n) )-ös muveletigény  u,  míg az euklideszi 3

 algoritmus változatai kvadratikusak. A másik probléma, hogy a számítási bonyolultság ero Sokkal hatékonyabb, ha a polinomegyenlet-rendszer sen függ a határozatlanok sorrendjétol. összes változóját egyszerre elimináljuk. Ez az út vezet el a többváltozós rezultánsok elméletéhez.

2.2.4. Moduláris legnagyobb közös osztó A polinomok közös gyökeinek létezésére és meghatározására szolgáló eddigi módszerek  volt a számítási tárrobbanás. Ösztönösen vetodik  mindegyikére jellemzo fel a kérdés: van-e  lehetoség moduláris módszerek alkalmazására? Az alábbiakban az a(x), b(x) vizsgáljuk (a, b Ekkor

,

0). Tekintsük a (2.4), (2.5)

∈ Z[x]

∈ Z[x] esetet = 13 prím.

polinomokat és legyen p

Z p [x]-ben a K-E algoritmus maradéksorozata az alábbi lesz: r0 r1 r2 r3 r4 r5

= = = = = =

+ 5x4 + 6x3 + 6x2 + 5 , 4 3 2 x + x + 2x + 8x + 8 , 3 2 3x + 8x + 12x + 1 , 2 x + 10x + 10 , 7x , 10 .

11x

5

Azt kapjuk tehát, hogy Z p [x]-ben az a és b polinomok relatív prímek. Az alábbi Z[x]-ben és Z p [x]-ben vett legnagyobb közös osztók közötti kapcsolatot írja le.

tétel a

2.8. tétel. Legyen a, b

∈ Z[x], a, b , 0. Legyen p olyan prím, amelyre p 6 | lc(a) és p 6 | lc(b). = lnko(a, b) ∈ Z[x], a p = a rem p, b p = b rem p és c p = c rem p. Ekkor   (1) deg lnko(a p , b p ) ≥ deg lnko(a, b) , (2) ha p 6 | res(a/c, b/c), akkor lnko(a p , b p ) = c p .

Legyen továbbá c

| a p és c p | b p ezért c p | lnko(a p , b p ). Így   deg lnko(a p , b p ) ≥ deg lnko(a, b) mod p .  Azonban a feltételek miatt p 6 | lc lnko(a, b) , ezért   deg lnko(a, b) mod p = deg lnko(a, b) .

Bizonyítás. (1) bizonyítása: mivel c p

(2) bizonyítása: mivel lnko(a/c, b/c)

= 1, valamint c p

lnko(a p , b p ) Ha lnko(a p , b p )

,

nemtriviális, ezért

= c p · lnko(a p /c p , b p /c p ) .

c p , akkor (2.13) jobb oldala nemtriviális, így res(a p /c p , b p /c p )

 szorzatainak összege, így p De a rezultáns az együtthatók megfelelo ellentmondás.

(2.13)

|

=

0.

res(a/c, b/c), ami

60

2. Komputeralgebra

2.9. következmény. Véges sok olyan p prím van, amire p   deg lnko(a p , b p ) > deg lnko(a, b) .

6|

lc(a), p

6|

lc(b) és

 Amikor a 2.8. tétel (1) állításában egyenloség teljesül, akkor azt mondjuk, hogy p egy szerencsés prím”. Máris körvonalazhatunk egy legnagyobb közös osztót kiszámoló modu” láris algoritmust. M --´(a, b) ´ 1 2 3 4 5 6

← a Landau–Mignotte-konstans (a 2.4. következmény szerint) ← {} while  do p ← olyan prím, melyre p ≥ 2M, p < H, p 6 | lc(a) és p 6 | lc(b) c p ← lnko(a p , b p ) if c p | a és c p | b M

H

7

then return c p

8

else H



H

∪ { p}

 sora a Landau–Mignotte-korlát kiszámítását kéri. A negyedik sor szerint Az algoritmus elso  elég nagy” prímet kell választani, amely nem osztja sem a, sem b foegyütthatóját. ” Az ötödik sor (például a Z p [x]-beli K-E algoritmussal) kiszámolja az a

olyan

és b polinomok legnagyobb közös osztóját modulo p. A kapott polinom együtthatóit szimmetrikus ábrázolással tároljuk. A hatodik sor c p

| a és c p | b teljesülését vizsgálja, melynek

igazsága esetén c p a keresett legnagyobb közös osztó. Ha ez nem teljesül, akkor p egy szerencsétlen prím”, így új prímet választunk. Mivel a 2.8. tétel szerint csak véges sok ”  szerencsétlen prím” van, ezért az algoritmus elobb-utóbb véget ér. Amennyiben a prímeket ”  stratégia szerint választjuk, a H halmaz alkalmazása szükségtelen. megfelelo A M --´ hátránya, hogy a bemeneti polinomok fokszámának növe´  így ez esetben nagy prímekkel kedtével a Landau–Mignotte-konstans exponenciálisan no, kell számolni. Felmerül a kérdés, hogyan módosítsuk az algoritmust, hogy mel” számolhassunk? Mivel

sok kis prím”

Z p [x]-ben a legnagyobb közös osztó az együtthatók konstans-

sal vett szorzata erejéig egyértelmu,  ezért az új algoritmusban ügyelni kell a részpolino tehát a kínai maradéktételt alkalmazzuk a különbözo  prímekmok együtthatóira. Mielott kel vett moduláris legnagyobb közös osztók együtthatóira, minden lépésnél normalizálni   kell az lnko(a p , b p ) foegyütthatóját. Amennyiben am és bn az a és b polinomok foegyütt hatói, akkor lnko(a, b) foegyütthatója osztja lnko(am , bn )-t. Primitív a és b polinomok ese tén lnko(a p , b p ) foegyütthatóját ezért lnko(am , bn ) mod p-re normalizáljuk, majd a legvégén vesszük az eredmény polinom primitív részét. Ahogy a M --´ algo´ ritmusnál, a moduláris számítások eredményét most is szimmetrikus ábrázolással tároljuk. Ezek a meggondolások vezetnek az alábbi, kis prímeket használó moduláris legnagyobb közös osztó algoritmushoz. M --´(a, b) ´

← lnko( lc(a), lc(b)) ← olyan prím, melyre H ← { p}

1

d

2

p

3

p

6| d

61

2.2. Polinomok közös gyökei

4 5 6 7 8 9

←p ← lnko(a p , b p ) g p ← (d mod p) · c p (n, i, j) ← (3, 1, 1) while  do if j = 1 P

cp

10

then if deg g p

11

=0

then return 1 (g, j, P)

12 13

if n

14

← (g p , 0, p)

≤i

then g

15

← pp(g) | a és g | b

if g

16

then return g

← olyan prím, melyre p 6 | d és p < H H ← H ∪ { p} c p ← lnko(a p , b p ) g p ← (d mod p) · c p if deg g p < deg g then (i, j) ← (1, 1) if j = 0 then if deg g p = deg g then g1 = EH-´ ´(g, g p , P, p) if g1 = g then i ← i + 1 else i ← 1 P ← P· p g ← g1

17

p

18 19 20 21 22 23 24 25 26 27 28 29 30

EH-´ ´(a, b, m1 , m2 )

6

←0 ← 1/m1 mod m2 for i ← deg a downto 0 do r ← ai mod m1 s ← (bi − r) mod m2 i p ← p + (r + s · m1 )x

7

return p

1 2 3 4 5

p

c

Észrevehetjük, hogy a M --´ algoritmusban nincs szükség annyi kis ´ prímre, mint amennyit a Landau–Mignotte-korlát meghatároz. Amennyiben a g polinom értéke néhány iteráción keresztül nem változik, a 13–16. sorokban teszteljük, hogy g valóban a legnagyobb közös osztó-e. Ezen iterációk számát tárolja a hatodik sor n változója.  Megjegyezzük, hogy n értékét a bemeneti polinomoktól függoen változtatni is lehetne. Az  algoritmusban használt prímeket célszeru  egy olyan elore eltárolt listából választani, amely  gépi szóban elféro  prémeket tartalmazza; ilyenkor a H halmaz az architektúrának megfelelo

62

2. Komputeralgebra

használata szükségtelen. A 2.9. következmény miatt a M --´ algorit´  mus befejezodik. Az EH-´ ´ algoritmus a bemeneti a, b polinomok azonos fokú tagjainak együtthatóira felírt, modulo m1 és m2 vett két lineáris kongruenciából álló egyenletrendszer megoldását  számolja ki a kínai maradéktételnek megfeleloen. Nagyon fontos, hogy az eredmény polinom együtthatóit szimmetrikus ábrázolással tároljuk.  2.9. példa. Eloször vizsgáljuk meg M --´ algoritmus muködését  a korábban is ´  vizsgált (2.4), (2.5) polinomokra. A könnyebb érthetoség kedvéért kis prímekkel fogunk számolni.  Emlékeztetoül, a(x)

=

63x

b(x)

=

−77x4 + 66x3 + 54x2 − 5x + 99 ∈ Z[x] .

5

+ 57x4 − 59x3 + 45x2 − 8 ∈ Z[x] ,

= 7, c p = x2 + 3x + 2 és g p = 2x + x − 1 lesznek. Mivel a 7. sor miatt a j változó értéke 1, ezért a 10–12. sorok végrehajtódnak. 2 A g p polinom nem nulla, ezért g = 2x + x − 1, j = 0, valamint P = 5 lesznek a végrehajtás utáni változóértékek. A 13. sorban a feltétel értéke nem teljesül, így újabb prímet választunk. A p = 7 rossz választás, a p = 11 viszont megengedett. A 19–20. sorok szerint ekkor c p = 1, g p = −4. Mivel deg g p < deg g, ezért j = 1 lesz és a 25–30. sorok nem hajtódnak végre. A g p polinom konstans, így a 11. sorban a visszatérési érték 1 lesz, jelezve, hogy az a és b polinomok relatív prímek.

 hat sorának végrehajtása után a p Az algoritmus elso

=

5 választással d

2

2.10. példa. Második példánkban tekintsük a korábbi a(x)

=

12x

b(x)

=

−12x3 + 80x2 − 84x + 24 ∈ Z[x] ,

4

− 68x3 + 52x2 − 92x + 56 ∈ Z[x] ,

= 5. Az algoritmus elso hat sora után d = 12, c p = x + 1, g p = 2x + 2. A = 5, g = 2x + 2 lesznek a változók értékei. A következo prím legyen p = 7. Így az új értékek c p = x + 4, g p = −2x − 1. Mivel deg g p = deg g, ezért a 25–30. sorok után  prímet válasszuk P = 35 és g új értéke 12x − 8 lesz. Az i változó értéke továbbra is 1. A következo 11-nek. Ekkor c p = g p = x + 3. A g p és g fokai megegyeznek, így g együtthatóit módosítjuk. Ekkor g1 = 12x − 8 és mivel g = g1 , ezért i = 2, valamint P = 385 lesznek. Az új prím legyen 13. Ekkor c p = x + 8, g p = − x + 5. A g p és g fokai továbbra is megegyeznek, ezért a 25–30 sorok végrehajtódnak, a változók értékei g = 12x − 8, P = 4654, i = 3 lesznek. A 17–18. sorok végrehajtása után kiderül, hogy g | a és g | b ezért a legnagyobb közös osztó g = 12x − 8. polinomokat. Legyen ismét p

10–12. sorok végrehajtása után P

Az alábbi tételt bizonyítás nélkül közöljük. 2.10. tétel. A M --´ algoritmus megfeleloen  muködik.  Az algoritmus ´ 3

számítási bonyolultsága O(m (log m

+ λ(K))2 )

gépi szóban mért muvelet,  ahol m

=

min{deg a, deg b}, K pedig az a és b polinomok Landau–Mignotte-korlátja.

Gyakorlatok 2.2-1.

Pn

Legyen R egy kommutatív egységelemes gyur  u,  a

=

Pm

i=0

ai x

i



R[x], b

=

bi x ∈ R[x], továbbá bn egység, m ≥ n ≥ 0. Az alábbi algoritmus az a és b polinomoki= 0  kal végzett maradékos osztás eredményeként eloállítja azokat a q, r ∈ R[x] polinomokat, i

melyekre a

= qb + r és deg r < n vagy r = 0.

63

2.3. Gröbner-bázis

E ´ --´ - ´ ´ (a, b)

7

←a ← m − n downto 0 do if deg r = n + i then qi ← lc(r)/bn i r ← r − qi x b else q ← 0 Pm−n i i q ← qi x és r i=0

8

return q

1 2 3 4 5 6

r

for i

Bizonyítsuk be, hogy az algoritmus legfeljebb (2 deg b

+ 1)(deg q + 1) = O(m2 )

R-beli muveletet  igényel. 2.2-2. Mi a különbség

Z-ben a B  ´-E és a B  ´-E-N ´

algoritmusok között?

· g, h) = res( f , h) · res(g, h). ∈ R[x] polinom (deg f = m, lc( f ) = fm ) diszkriminánsának a

2.2-3. Bizonyítsuk be, hogy res( f 2.2-4. Az f (x)

discr f elemet nevezzük, ahol f

0

=

(−1)

m(m−1) 2

0

res( f , f )

fm

∈R

az f x-beli deriváltját jelenti. Az f polinomnak nyilván akkor és

csak akkor van többszörös gyöke, ha diszkriminánsa nulla. Számítsuk ki (discr f )-et általános másod- és harmadfokú polinomok esetében.

2.3. Gröbner-bázis Legyen F test, R

=

F[x1 , x2 , . . . , xn ] az F feletti n-határozatlanú polinomok gyur  uje,  to-

vábbá legyen f1 , f2 , . . . , f s



R. Állapítsuk meg, hogy mi annak a szükséges és elégséges

feltétele, hogy az f1 , f2 , . . . , f s polinomoknak legyen közös gyöke R-ben. Látható, hogy a  o  alfejezet s probléma az eloz

= 2 esetének bizonyos értelemben vett általánosítása.

Jelölje I

= h f1 , . . . , f s i =

X

 qi fi : qi

∈R

1≤i≤ s

az f1 , . . . , f s polinomok által generált ideált. Ekkor az f1 , . . . , f s polinomok az I ideál bázisát alkotják. Az I ideál varietásán a

 V (I)

=

u

 ∈

F

n

: f (u)

=0

minden f



I polinomra

halmazt értjük. A varietás ismerete természetesen az f1 , . . . , f s polinomok közös megoldása legfontosabb kérdések: inak ismeretét is jelenti. A varietásról, illetve az I ideálról felteheto



V (I)

,∅?

64

2. Komputeralgebra



V (I)



Adott f



I

mekkora” ? ”

∈ R esetén

f



I?

=R?

Az I ideál Gröbner-bázisa egy olyan bázis, ahol ezeket a kérdéseket könnyu  megválaszolni.  vizsgáljuk meg az n Mindenekelott

= 1 esetet. Mivel F[x] euklideszi gyur  u,  ezért

h f1 , . . . , f s i = h lnko( f1 , . . . , Feltehetjük, hogy s

=

2. Legyen f , g

egyértelmuen  léteznek olyan q, r





fs )

i.

(2.14)

F[x], és osszuk el maradékosan f -et g-vel. Ekkor

F[x] polinomok, melyekre f

= qg+r, ahol deg r < deg g.

Vagyis f továbbá V (g)

= {u1 , . . . , ud },

∈ hgi ⇔ r = 0 ,

amennyiben x



u1 , . . . , x



ud a g



F[x] polinom összes

 lineáris faktora. Sajnos, a (2.14) egyenloség  különbözo két vagy több határozatlan esetén  akármilyen test feletti többváltozós polinomgyur már nem teljesül. Sot,  u  nem euklideszi  gyur  u,  így a maradékos osztás lehetoségét is újra kell gondolni. Ebben az irányban haladunk tovább.

2.3.1. Monomiális rendezés A ` `

⊆ Nn teljes rendezési relációt megengedettnek nevezzük, ha n (i) (0, . . . , 0)  v minden v ∈ N -re, n (ii) minden v1 , v2 , v ∈ N esetén v1  v2 ⇒ v1 + v  v2 + v. n Nem nehéz bizonyítani, hogy N minden megengedett rendezése

egyben jólrendezés is

(vagyis bármely nemüres részhalmazának van legkisebb eleme). A korábbi jelöléseket gyelembe véve tekintsük a T

= { x1i · · · xni } 1

n

halmazt, melynek elemeit monomoknak nevezzük. Vegyük észre, hogy T

zárt az

F[x1 , . . . , xn ]-beli szorzásra, valamint a muvelettel  kommutatív monoidot alkot. Az T , (i1 , . . . , in )

7→

x

i1

1

· · · xni

n

leképezés izomorzmus, ezért egy T -beli



Nn →

megengedett teljes

rendezésre (i) 1

 t minden t ∈ T -re, ∈ T esetén t1 ≺ t2 ⇒ t1 t ≺ t2 t.

(ii) minden t1 , t2 , t

A T -beli megengedett rendezéseket monomiális rendezéseknek nevezzük. Tekintsünk néhány példát. Legyen

α=

x

i1

1

· · · xni , β = n

x

j1 1

· · · xnj ∈ T . n

Ekkor az alábbi rendezéseket szokás deniálni.



Lexikograkus rendezés.

α ≺lex β ⇔ létezik olyan l ∈ {1, . . . , n}, hogy il < •

jl és il+1

=

jl + 1 , . . . , in

=

jn .

Tiszta lexikograkus rendezés.

α ≺ plex β ⇔ létezik olyan l ∈ {1, . . . , n}, hogy il <

jl és i1

=

j1 , . . . , il − 1

=

jl−1 .

65

2.3. Gröbner-bázis



Összfokszám szerint, majd lexikograkus rendezés.

α ≺grlex β ⇔ i1 + · · · + in < •

+ ··· +

j1

jn vagy (i1

+ · · · + in =

j1

+ ··· +

jn és

α ≺lex β).

Összfokszám szerint, majd fordított lexikograkus rendezés.

α ≺tdeg β ⇔ i1 + · · · + in < j1 + · · · + jn vagy (i1 + · · · + in = ∈ {1, . . . , n}, melyre il > jl és il+1 = jl+1 , . . . , in = jn ).

j1

+···+

jn és létezik olyan

l

 ≺grrevlex -nek jelölik ( graded reverse lexicogA ≺tdeg monomiális rendezést némely szerzok ” raphic order”), hiszen a rendezés a monomok fokszámösszehasonlítás utáni lexikograkus rendezésének felel meg. 2.11. példa. Legyen

≺=≺ plex . Ekkor z ≺ y ≺ ≺

1

z



y

≺ Legyen

≺=≺tdeg . Ekkor z ≺ y ≺

x esetén

≺ z2 ≺ · · · ≺ y ≺ yz ≺ yz2 ≺ · · · 2

xy

≺ y2 z ≺ y2 z2 ≺ · · · x ≺ ≺

xy

2

≺ ··· ≺

x

2

xz



xz

2

≺ ···

≺ ··· .

x esetén

1



z



z

2

≺ yz ≺



z

3

≺ yz2 ≺

2

≺y ≺



≺y≺

x z

x

3

xz

≺ y2 ≺

xz

2

xy

2

xy

≺ y2 z ≺ ≺

2

x y



x

2

xyz



x

3

≺ ··· .

A továbbiakban mindig feltesszük, hogy valamilyen rögzített monomiális rendezés

P

α ∈ R egy nem nulla polinom, cα ∈ F és α∈Nn cα x α monomiális rendezés. Ekkor cα x (cα , 0) az f polinom tagjai,

mellett dolgozunk. Legyen f

=

≺ = max{α ∈ Nn : cα , 0} a polinom multifoka (a maximum a monomiális rendezés mdeg( f )  lc( f ) = cmdeg( f ) ∈ F \ {0} a polinom foegyütthatója, mellett értendo),  lm( f ) = x ∈R  a polinom fomonomja, lt( f ) = lc( f ) · lm( f ) ∈ R a polinom fotagja.  Legyenek továbbá lt(0) = lc(0) = lm(0) = 0 és mdeg(0) = −∞. legyen adott egy mdeg( f )

2.12. példa. Tekintsük az f (x, y, z)

≺=≺ plex

és z

≺y≺

mdeg( f ) ha pedig

≺=≺tdeg

= 2xyz2 − 3x3 + 4y4 − 5xy2 z ∈ Q[x, y, z] polinomot. Amennyiben

x, akkor

és z

≺y≺

= (3, 0, 0),

lt( f )

= −3x3 ,

lm( f )

=

,

lc( f )

= −3 ,

= 4y4 ,

lm( f )

= y4 ,

lc( f )

=4.

x

3

x, akkor

mdeg( f )

= (0, 4, 0),

lt( f )

2.3.2. Többváltozós polinomok maradékos osztása Ebben a pontban adott f , f1 , . . . , f s rendezés esetén olyan q1 , . . . , q s





R többváltozós polinomok és adott

R és r





monomiális

R polinomokat keresünk, melyekre f

· · · + q s f s + r és r egyetlen monomja sem osztható lt( f1 ), . . . , lt( f s ) egyikével sem.

=

q1 f 1

+

66

2. Komputeralgebra

T  ´ --´ - ¨ ´ ´ ( f , f1 , . . . , f s )

←0 ← f for i ← 1 to s do qi ← 0 while p , 0

1

r

2

p

3 4 5 6

∈ {1, . . . , s}-re lt( fi ) | lt( p) ← qi + lt( p)/ lt( fi ) p ← p − lt( p)/ lt( fi ) fi r ← r + lt( p) p ← p − lt( p)

do if valamilyen i

7

then az egyik ilyen i-re qi

8 9

else

10

return q1 , . . . , q s és r

11

Az algoritmus helyes muködése  abból következik, hogy az 5–10. sorok while ciklusának minden iterációjában fennállnak az alábbi tulajdonságok:

 mdeg( f ) és f = p + q1 f1 + · · · + g s f s + r, , 0 ⇒ mdeg(qi fi )  mdeg( f ) minden 1 ≤ i ≤ s esetén,

(i) mdeg( p) (ii) qi

(iii) r egyetlen tagja sem osztója egyik lt( fi )-nek sem. Algoritmusunknak van egy gyenge pontja: a többváltozós polinomok maradékos osztása  i értékek közül tetszolegesen  nem egyértelmu.  A 7. sorban a megfelelo választhatunk. 2.13. példa. Legyen f y

≺ plex

=

x y + xy 2

2

+ y2 ∈ Q[x, y],

f1

=

xy − 1, f2

= y2 − 1, a monomiális rendezés ≺ plex ,

 i értéket válasszuk. Ekkor az algoritmus x, és a 7. sorban mindig a legkisebb indexu  megfelelo

= x + y, q2 = 1, r = x + y + 1. De ha f1 és f2 szerepét felcseréljük, vagyis = xy − 1, akkor az algoritmus kimenete q1 = x + 1, q2 = x és r = 2x + 1 lesz.

eredménye q1 f2

f1

= y2 − 1 és

Az iménti példában látott módon (nevezetesen, hogy az pszeudokód 7. sorában mindig  pozitív i értéket választjuk) az algoritmus determinisztikussá teheto.  a legkisebb megfelelo Ilyenkor a q1 , . . . , q s hányadosok és az r maradék egyértelmu,  amit úgy jelölünk, hogy r

=

f rem ( f1 , . . . , f s ). Az s

=

1 esetben az algoritmus választ ad az ideál-tartalmazás problémájára: f

∈ h f1 i

akkor és csak akkor, ha az f polinom f1 polinommal vett maradékos osztásakor a maradék nulla. Sajnos s

≥ 2 esetén ez nem teljesül: a ≺ plex xy

2

−x

rem (xy

mutatja, hogy xy

+ 1, y2 − 1) = − x − y,

 viszont = y, q2 = 0. Másrészrol − x ∈ h xy + 1, y2 − 1i.

a hányadosok pedig q1 2

monomiális rendezéssel

xy

2

−x=

x

· (y2 − 1) +

0, ami azt

2.3.3. Monomiális ideálok és Hilbert-féle bázistétel  További célunk tetszoleges polinomideálhoz olyan bázis keresése, hogy ezzel a bázissal vett maradékos osztáskor a maradék egyértelmu  legyen, így választ tudjunk adni az ideáltartalmazás problémára. Vajon ilyen bázis egyáltalán létezik? És ha igen, véges elemszámú? Az I

⊆ R ideált monomiális ideálnak nevezzük, ha létezik olyan A ⊆ Nn , melyre I

= h xA i = h{ xα ∈ T : α ∈ A}i ,

vagyis az ideált monomok generálják.

67

2.3. Gröbner-bázis

2.11. lemma. Legyen I

= h xA i ⊆ R egy monomiális ideál, és β ∈ Nn . Ekkor x

Bizonyítás. A melyekre x

β

=

β

∈ I ⇔ ∃α ∈

A

x

α

|

x

β

.

⇐ irány nyilvánvaló. Megfordítva, legyen α1 , . . . , α s ∈ P α α i

β

qi x i . Ekkor az összegnek legalább egy olyan qi x

 x elofordul, így x

αi

|

i

A és q1 , . . . , q s



R,

tagja létezik, melyben

β

x .

A lemma legfontosabb következménye, hogy monomiális ideálok pontosan akkor egyeznek meg, ha ugyanazokat a monomokat tartalmazzák. 2.12. lemma (Dickson-lemma). minden A

Minden monomiális ideál végesen generálható, vagyis

⊆ Nn -hez létezik olyan B ⊆

A véges halmaz, melyre h x

= F[x1 , . . . , xn ]-ben. Ha G ⊆ = hlt(I)i, akkor hGi = I.

2.13. lemma. Legyen I egy ideál R melyre hlt(G)i

A

i = h x B i.

I egy olyan véges halmaz,

 = {g1 , . . . , g s }. Ha f ∈ I egy tetszoleges polinom, akkor G-vel vett = q1 g1 + · · · + q s g s + r, ahol q1 , . . . , q s , r ∈ R olyanok, hogy  vagy r = 0, vagy r egyetlen tagja sem osztható egyetlen gi fotagjával sem. De ekkor r = f − q1 g1 − · · · − g s g s ∈ I, és így lt(r) ∈ lt(I) ⊆ hlt(g1 ), . . . , lt(g s )i. A (2.11) lemma miatt ezért r = 0, vagyis f ∈ hg1 , . . . , g s i = hG i.

Bizonyítás. Legyen G

maradékos osztás szerint f

Amennyiben a Dickson-lemmát

hlt(I)i-re

alkalmazzuk, továbbá gyelembe vesszük,

hogy a zérópolinom a h0i ideált generálja, az alábbi nevezetes eredményt kapjuk. 2.14. tétel (Hilbert-féle bázistétel). Minden I ható, vagyis létezik olyan G





R

=

∈ N, melyre In =

In+1

=

I és hlt(G)i

⊆ I2 ⊆ · · · = ··· .

2.15. következmény (ideállánc-feltétel). Legyen I1 lánca. Ekkor létezik olyan n

F[x1 , . . . , xn ] ideál végesen generál-

I véges halmaz, melyre hG i

= hlt(I)i.

R-beli ideálok egy növekvo 

= ∪ j≥1 I j . Ekkor I ideál, ami a Hilbert-féle bázistétel miatt végesen = hg1 , . . . , g s i. Az n = min{ j ≥ 1 : g1 , . . . , g s ∈ I j } választással azt = In+1 = · · · = I.

Bizonyítás. Legyen I

generálható. Legyen I kapjuk, hogy In

Azokat a gyur  uket,  melyekben teljesül az ideál-lánc feltétel, Noether-gyur  uknek  nevezzük. Speciálisan, amennyiben F test, akkor F[x1 , . . . , xn ] Noether-gyur  u.  Legyen az I ideál





egy monomiális rendezés R-en és I



Hilbert-féle bázistétel következménye az alábbi

⊆ I véges halmazt hlt(G)i = hlt(I)i. A

R egy ideál. A G

rendezésre vonatkozó Gröbner-bázisának nevezzük, ha

68

2. Komputeralgebra

2.16. következmény. R

=

F[x1 , . . . , xn ] minden I ideáljának van Gröbner-bázisa.

Könnyu  megmutatni, hogy egy G Gröbner-bázissal vett maradékos osztáskor a maradék

=

 Ilyenkor az f rem G nem függ a báziselemek sorrendjétol.

r



R jelölés használatos. Az

alábbi tétel szerint a Gröbner-bázis segítségével az ideál-tartalmazás problémája egyszeruen  megválaszolható.

⊆ R ideál ≺ monomiális rendezésre vonatkozó Gröbner-bázisa és ∈ I ⇔ f rem G = 0.

2.17. tétel. Legyen G az I legyen f

∈ R. Ekkor

f

Bizonyítás. Bebizonyítjuk, hogy egyértelmuen  létezik olyan r

∈ R, amelyre (1) f − r ∈

I, (2)

r egyetlen tagja sem osztható lt(G) egyetlen monomjával sem. Ilyen r létezése a maradékos osztásból következik. Az egyértelmuséghez  feltesszük, hogy f h1 , h2



g

− r2 = h2 − h1 ∈ I, továbbá a 2.11. lemma ∈ G-re. Ez azt jelenti, hogy r1 − r2 = 0.

h

=

r1

= h1 +r1 = h2 +r2 valamilyen

I-re és r1 vagy r2 egyik tagja sem osztható lt(G) egyetlen monomjával sem. Ekkor miatt lt(r1

− r2 )

Ha tehát G az R egy Gröbner-bázisa, akkor minden f , g, h f rem G

osztható lt(g)-vel valamely



R esetén g

=

f rem G és

⇒ g = h.

2.3.4. A Buchberger-algoritmus Észrevehetjük, hogy a Hilbert-féle bázistétel nem konstruktív: nem ad választ arra, hogyan konstruáljuk meg egy I ideál Gröbner-bázisát. Az alábbiakban úgy okoskodunk, hogy azt vizsgáljuk, egy véges halmaz mikor nem Gröbner-bázisa az I ideálnak. Legyenek g, h (β1 , . . . , βn )

=



R nem nulla polinomok,

mdeg(h),

γ =

polinomján az S (g, h)

=

x

γ

lt(g)

g

polinomot értjük. Észrevehetjük, hogy S (g, h) így S (g, h)

∈ hg, hi.

α =

(α1 , . . . , α n )

=

mdeg(g),

β =

(max{α1 , β1 }, . . . , max{αn , βn }). A g és h polinomok S-



x

γ

lt(h)

h

∈R

= −S (h, g),

továbbá x

γ

/ lt(g), xγ / lt(h) ∈

R

 bizonyítás nélkül közölt tétel egy egyszeru A most következo,  tesztet

ad egy halmaz Gröbner-bázis mivoltára. 2.18. tétel. A G

= {g1 , . . . , g s } ⊆

R halmaz akkor és csak akkor lesz a hG i ideál Gröbner-

bázisa, ha S (gi , g j ) rem (g1 , . . . , g s )

=0

minden 1

≤i< j≤

s esetén .

Az S -polinomok segítségével könnyen adható Gröbner-bázist konstruáló algoritmus (Buchberger, 1965): adott f1 , . . . , f s



R

az alábbi algoritmus megadja az I

= F[x1 , . . . , xn ] és adott ≺ monomiális rendezés mellett = h f1 , . . . , f s i ideál egy G ⊆ R Gröbner-bázisát.

69

2.3. Gröbner-bázis

G - ( f1 , . . . , f s ) ¨ ´

← { f1 , . . . , f s } ← {( fi , f j ) | fi , f j ∈ G, i < j, fi , f j } while P , ∅   do ( f , g) ← egy tetszoleges pár P-bol P ← P \ ( f , g) r ← S ( f , g) rem G if r , 0 then G ← G ∪ {r } P ← P ∪ {( f , r) | f ∈ G }

1

G

2

P

3 4 5 6 7 8 9 10

return G

 Eloször megmutatjuk, hogy a G - algoritmus helyesen muködik.  Az algoritmus ¨ ´ futásának bármely pillanatában G az I ideál bázisa, hiszen kezdetben az, a továbbiakban  képzett S-polinomok Gpedig kizárólag olyan elemek kerülnek G-be, melyeket G elemeibol  vel vett maradékos osztásaként kapunk. Amennyiben az algoritmus befejezodik, az összes  S -polinom G-vel vett maradéka nulla, így a (2.18) tétel miatt G egy lehetséges képezheto Gröbner-bázis.  Most bebizonyítjuk, hogy az algoritmus befejezodik. Legyenek G és G



a pszeudo-

 végrehajtásakor kapott halmazok. Nyilván G kód while ciklusa két egymást követo





G ,



hlt(G)i ⊆ hlt(G )i. De a (2.15) következmény miatt az egymást követo iterációk hlt(G)i ideállánca stabilizálódik, vagyis véges számú lépés után hlt(G)i = hlt(G∗ )i teljesül. ∗ ∗ Azt állítjuk, hogy ekkor G = G . Legyen f , g ∈ G és r = S ( f , g) rem G. Ekkor r ∈ G és ∗  a maradék képzésének deníciója miatt vagy r = 0 vagy lt(r) ∈ hlt(G )i = hlt(G)i, amibol r = 0 következik.

továbbá

= Q, ≺=≺ plex , z ≺ y ≺ x, f1 = x − y − z, f2 = x + y − z2 , f3 = x2 + y2 − 1. Ekkor  sora miatt G = { f1 , f2 , f3 }, a második sorból pedig P = {( f1 , f2 ), ( f1 , f3 ), ( f2 , f3 )}. a pszeudokód elso  végrehajtása során válasszuk az ( f1 , f2 ) párt. Ekkor P = {( f1 , f3 ), ( f2 , f3 )}, A while ciklus elso 2 2 S ( f1 , f2 ) = −2y − z + z és r = f4 = S ( f1 , f2 ) rem G = −2y − z + z . Ezért G = { f1 , f2 , f3 , f4 } és P = {( f1 , f3 ), ( f2 , f3 ), ( f1 , f4 ), ( f2 , f4 ), ( f3 , f4 )}. A ciklus második végrehajtásakor válasszuk az ( f1 , f3 ) párt. Ekkor P = P \ { f1 , f3 }, S ( f1 , f3 ) = − xy − xz − y2 + 1, r = f5 = S ( f1 , f3 ) rem G = −1/2z4 − 1/2z2 + 1, így G = { fi | 1 ≤ i ≤ 5} és P = {( f2 , f3 ), ( f1 , f4 ), . . . , ( f3 , f4 ), ( f1 , f5 ), . . . , ( f4 , f5 )}. A ciklus harmadik végrehajtása során válasszuk az ( f2 , f3 ) párt. Ekkor P = P \ {( f2 , f3 )}, 2 2 S ( f2 , f3 ) = xy − xz − y + 1, r = S ( f2 , f3 ) rem G = 0. A while ciklus negyedik végrehajtása során válasszuk az ( f1 , f4 ) párt. Ekkor P = P \ { f1 , f4 }, 2 2 S ( f1 , f4 ) = 2y + 2yz + xz − xz , r = S ( f1 , f4 ) rem G = 0. 2.14. példa. Legyen F

Hasonlóan, az összes fennmaradó pár S -polinomjának G-vel vett maradékos osztásakor a mara érték G dék 0, így a visszatéro

= { x − y − z, x + y − z2 , x2 + y2 − 1, −2y − z + z2 , −1/2z4 − 1/2z2 + 1}

egy Gröbner-bázis.

2.3.5. Redukált Gröbner-bázis A Buchberger-algoritmus által eredményezett Gröbner-bázis általában nem minimális és  elérheto.  nem egyértelmu.  Szerencsére egy kis ravaszkodással mindketto

70

2. Komputeralgebra

2.19. lemma. Ha G az I

⊆ R ideál egy Gröbner-bázisa és lt(g) ∈ hlt(G \ {g})i, akkor G \ {g}

is egy Gröbner-bázisa I-nek. Azt mondjuk, hogy a G

⊆ R halmaz ∈ G esetén

az I

= hGi

ideál minimális Gröbner-bázisa, ha

Gröbner-bázis és minden g



lc(g)

= 1,



lt(g)

< hlt(G \ {g})i.

A G Gröbner-bázis egy g az

hlt(G \ {g})i



G eleme redukált a G-re nézve, ha g egyetlen monomja sincs

ideálban. Egy minimális G Gröbner-bázis redukált, ha G-re vonatkozóan

minden eleme redukált. 2.20. tétel. Minden ideálhoz egyértelmuen  létezik egy redukált Gröbner-bázis.

is Gröbner-bázis. Nem nehéz megmutatni, hogy G r

0

= { x−y−z, −2y−z+z2 , −1/2z4 −1/2z2 +1} = { x − 1/2z2 − 1/2z, y − 1/2z2 − 1/2z, z4 + z2 − z}

2.15. példa. A 2.14. példát alapul véve nemcsak G, hanem G redukált Gröbner-bázis.

2.3.6. A Gröbner-bázis számítási bonyolultsága A Gröbner-bázis elmélet kialakulása óta eltelt fél évszázad sem volt elég teljesen tisztázni az algoritmus számítási bonyolultságát. A tapasztalatok azt mutatják, hogy számítási tárrobbanással állunk szemben. De most, ellentétben az euklideszi algoritmus variánsainál látott számítási tárrobbanással, a növekedés ütemét nem lehet kordában tartani. A Gröbner számítási bonyolultságot szokás az EXPSPACE-teljes osztályba bázis számításnál fellépo sorolni. Legyenek f , f1 , . . . , f s mok (≺=≺tdeg ). Ha f

∈ F[x1 , . . . , xn ] az F ∈ h f1 , f2 , . . . f s i, akkor f

olyan g1 , . . . , g s



=

f1 g1

+ ··· +

test feletti legfeljebb d-ed fokú polino-

fs gs

F[x1 , . . . , xn ] polinomokra, melyek fokai

β = β(n, d) =

(2d)

2

n

-nel fe-

 korlátosak. Ez a duplán exponenciális korlát lényegében elkerülhetetlen, amit számos lülrol

= Q esetben az ideál-tartalmazás probléma ilyen. Szerencsére, = 1 (a Hilbert-féle Nullstellensatz), n+1 n akkor a d = 2 esetben β = 2 , a d > 2 esetben pedig β = d . Márpedig a V ( f1 , . . . , f s ) varietás pontosan akkor üres, ha 1 ∈ h f1 , f2 , . . . f s i, vagyis a polinomegyenlet-rendszerek példa bizonyít. Sajnos, az F

 el. Ha f speciális esetekben drasztikus redukció érheto

megoldhatósága PSPACE-beli probléma. Számos eredmény szól amellett, hogy bizonyos feltételek mellett az (általános) ideál-tartalmazás probléma is PSPACE-beli. Ilyen feltétel például, hogy

h f1 , f2 , . . . f s i zéró-dimenziós.

Ezen

bonyolultság

számítási

ellenére

a

Gröbner-bázis

elmélet

komoly

sikere-

ket könyvelhet el: automatikus geometriai tételbizonyítás, robotok mozgásvezérlése és polinomegyenlet-rendszerek megoldása talán a legelterjedtebb alkalmazási területek. Az alábbiakban felsoroljuk azokat az területeket, ahol az elmélet sikeresen alkalmazható.



Polinomegyenletek ekvivalenciája.

Két polinomhalmaz pontosan akkor generálja

 ugyanazt az ideált, ha Gröbner-bázisuk megegyezik (tetszoleges monomiális rendezés mellett).

71

2.4. Szimbolikus integrálás



Polinomegyenletek megoldhatósága. Az fi (x1 , . . . , xn ) pontosan akkor oldható meg, ha az 1



= 0,

1

≤i≤

s egyenletrendszer

< h f1 , . . . , f s i .

Polinomegyenletek megoldáshalmaza végessége. Az fi (x1 , . . . , xn )

=

egyenletrendszernek pontosan akkor van véges számú megoldása, ha

0, 1 ≤ i ≤ s h f1 , . . . , f s i-ben

minden xi változóhoz van olyan polinom, hogy az adott monomiális rendezés melletti  fotagja xi valamilyen hatványa.



Polinomegyenletek véges megoldásai száma. Legyen az fi (x1 , . . . , xn )

= 0,

1



i



s

egyenletrendszernek véges sok megoldása. Ekkor multiplicitással számolva a polinomegyenlet megoldásszáma azon monomok halmazának számossága, melyek nem többszörösei a

  h f1 , . . . , f s i Gröbner-bázisa elemei egyetlen fotagjának sem (tetszoleges mo-

nomiális rendezés mellett).



Kifejezések egyszerusítése. 

A legutóbbira példát is mutatunk. 2.16. példa. Legyenek a, b, c a

∈ R olyanok, hogy

+ b + c = 3,

2

a

+ b2 + c2 = 9,

3

a

+ b3 + c3 = 24 .

4 + b4 + c4 értékét. Legyenek tehát f1 = a + b + c − 3, f2 = a2 + b2 + c2 − 9 és a3 + b3 + c3 − 24 R[a, b, c] elemei, továbbá legyen ≺=≺ plex , c ≺ b ≺ a. Ekkor az h f1 , f2 , f3 i Gröbner-bázisa

Számítsuk ki a az

G 4

Így a

+ b4 + c4 rem

G

= {a + b + c − 3, b2 + c2 − 3b − 3c + bc, 1 − 3c2 + c3 } . = 69, ami a feladat megoldása.

Gyakorlatok 2.3-1. Bizonyítsuk be, hogy a

≺lex , ≺ plex , ≺grlex

és

≺tdeg

monomiális rendezések valóban

megengedettek.

≺ egy monomiális rendezés R-en, f , g ∈ R \ {0}. Lássuk be az alábbiakat: = mdeg( f ) + mdeg(g), f + g , 0, akkor mdeg( f + g)  max{mdeg( f ), mdeg(g)}, ahol mdeg( f ) , mdeg(g)

2.3-2. Legyen

(a) mdeg( f g) (b) ha

 esetén egyenloség teljesül.

= 2x4 y2 z − 3x4 yz2 + 4xy4 z2 − 5xy2 z4 + 6x2 y4 z − 7x2 yz4 ∈ Q[x, y, z]. ≺ plex , ≺grlex és ≺tdeg monomiális rendezések esetén, ahol mindhárom esetben z ≺ y ≺ x. (b) Mindhárom monomiális rendezés esetén határozzuk meg mdeg( f ), lc( f ), lm( f ) és

2.3-3. Legyen f

(a) Rendezzük a polinom tagjait

lt( f )-et.

2.3-4.? Bizonyítsuk be a Dickson-lemmát.

= h x2 + y − 1, xy − xi ⊆ Q[x, y] ideál Gröbner-bázisát és redukált Gröbner-bázisát a ≺=≺lex monomiális rendezés esetén, ahol y ≺ x. Határozzuk meg, hogy 2 2 2 az alábbi polinomok közül melyik eleme az ideálnak: f1 = x + y − y, f2 = 3xy − 4xy + x + 1. 2.3-5. Számítsuk ki az I

2.4. Szimbolikus integrálás A határozatlan integrálás problémája egy adott f függvényhez olyan g függvényt ta-

0

lálni, amelynek deriváltja f , azaz amelyre g (x)

=

f (x); ezen összefüggés jelölésére az

72

2. Komputeralgebra

R f (x) d x

=

 analízis eloadásokon  g(x) jelölést is használjuk. A bevezeto a határozatlan in-

 módszerekkel próbálkozunk, amelyek között tegrálási problémák megoldására különbözo heurisztikus módon próbálunk választani: helyettesítések, trigonometrikus helyettesítések, parciális integrálás stb. Csak a racionális törtfüggvények integrálására szokás algoritmikus módszert használni. Megmutatható, hogy a határozatlan integrálás teljes általánosságban algoritmussal meg oldhatatlan probléma. Tehát csak arra van lehetoségünk, hogy minél nagyobb algoritmussal megoldható részt keressünk.  lépés a probléma algebraizálása: teljesen elvonatkoztatunk minden analízisbeli Az elso fogalomtól, és a differenciálást úgy tekintjük, mint egy új (egyváltozós) algebrai muveletet,  amely az összeadással és a szorzással adott kapcsolatban van, és ennek a muveletnek  az inverzét” keressük. Ez a felfogás vezetett a differenciálalgebra fogalmának bevezetéséhez. ” A komputeralgebra rendszerek (például a M) integráló rutinja, hasonlóan hozzánk,  eloször néhány heurisztikus módszerrel próbálkozik. Polinomok (vagy kicsit általánosabban, véges Laurent-sorok) integrálja könnyen meghatározható. Ezután egy egyszeru  táblázatban való keresés következik (a M esetén például 35 alapintegrál felhasználása).  bevitt integráltáblázatokat is használni. Ezután speciális eseteket Lehet persze könyvekbol  módszerek ismertek. Például kereshetünk, amelyre megfelelo e

ax+b

sin(cx

+ d) · p(x)

alakú integrálok esetén, ahol p polinom, parciális integrálás használható az integrál meghatározására. Ha a fenti módszerek sikertelenek, akkor helyettesítéssel próbálkozik az úgynevezett

beosztás a deriválttal” módszer formájában: ha az integrandus összetett kifeje” zés, akkor minden f (x) részkifejezésére osztunk f deriváltjával, majd kipróbáljuk, hogy

u

=

 eltunik-e f (x) helyettesítés után a kapott kifejezésbol  x. Ezek az egyszeru  módsze-

   rek meglepoen sok határozatlan integrál kiszámítására elegendoek. Nagy elonyük, hogy az egyszeru  problémákat gyorsan oldják meg. Ha nem vezetnek célhoz, akkor próbálkozunk  a racionális törtfüggvények integrálása. az algoritmikus módszerekkel. Ezek között az elso Mint látni fogjuk, a komputeralgebra rendszerekben használt változat lényegesen eltér a kézi  még bonyolult esetekben is számolásra használt változattól, mert a cél az, hogy a futási ido  legegyszerubb kicsi legyen, és az eredmény a leheto  formában keletkezzen. Az elemi függvények integrálására használt Risch-algoritmus a racionális törtfüggvények integrálására használt algoritmusokon alapul. Ezt is ismertetjük, de nem tárgyaljuk teljes részletességgel. A bizonyításokra inkább csak utalunk.

2.4.1. Racionális függvények integrálása  Ebben a pontban bevezetjük a differenciáltest és a differenciáltest bovítésének fogalmát, majd ismertetjük Hermite módszerét. Differenciáltest Legyen K egy nulla karakterisztikájú test, amelyen adott egy f önmagába az alábbi két tulajdonsággal: (1) ( f

+ g)0 =

(2) ( f g)

0

=

0

f

f g

0

+ g0

+ g0 f

(additivitás); (Leibniz-szabály).

7→

f

0

leképezése K-nak

73

2.4. Szimbolikus integrálás

7→ f 0 leképezést differenciáloperátornak, differenciálásnak vagy deriválásnak, 0 K-t pedig differenciáltestnek nevezzük. A C = {c ∈ K : cR = 0} halmaz a konstansok 0 részteste K-ban. Ha f = g, akkor azt is írjuk, hogy f = g. Nyilván bármely c ∈ C R 0 konstansra f + c = g. Egy 0 , f ∈ K elem logaritmikus deriváltján f / f -et értjük.

Ekkor az f

(Formálisan ez

log( f ) deriváltja”.) ”

2.21. tétel. Az eloz  o  deníció jelöléseivel, a deriválás szokásos tulajdonságai teljesülnek:

0

(1) 0

= 10 = (−1)0 = 0;

(2) a differenciálás C-lineáris: (a f (3) ha g

(5)

f tetszoleges,  akkor ( f /g)

0

K, a, b

∈ C;

= ( f 0 g − g0 f )/g2 ;

= n f 0 f n−1 , ha 0 , f ∈ K és n ∈ Z; R 0 0 fg = fg − g f , ha f , g ∈ K (parciális integrálás).

n

(4) ( f )

R

, 0,

+ bg)0 = a f 0 + bg0 , ha f , g ∈

0

2.17. példa.

7→ 0 leképezés K-n a triviális deriválás, erre C = K. = Q(x). Egyetlen olyan differenciálás van Q(x)-en, a szokásos, amelyre x0 = 1. Q elemei. Valóban, indukcióval n0 = 0, ha n ∈ N, és így Z illetve Q elemei is

 o  deníció jelöléseivel, az f (1) Az eloz (2) Legyen K Erre a konstansok

konstansok. Indukcióval adódik, hogy a hatványfüggvények deriváltja a szokásos, ahonnan a linearitás miatt a polinomoké is, így a hányados differenciálási szabálya szerint kapjuk az állítást. Nem nehéz kiszámolni, hogy a szokásos differenciálásra a konstansok

Q elemei.

 C(x), ahol C tetszoleges nulla karakterisztikájú test, akkor egyetlen olyan differen0 ciálás van K-n, a szokásos, amelyre a konstansok részteste C és x = 1; az állítás hasonlóan adódik, (3) Ha K

=

 o.  mint az eloz

 Ha C tetszoleges nulla karakterisztikájú test és K

=

C(x) a szokásos differenciálással,

akkor 1/ x nem deriváltja semminek. (Az állítás bizonyítása nagyon hasonlít annak bizonyí-



tásához, hogy

 2 irracionális, de kettovel való oszthatóság helyett az x polinommal való

oszthatósággal kell dolgoznunk.) A példa azt mutatja, hogy 1/ x és más hasonló függvények integrálásához a differenci áltestet bovíteni kell. A racionális törtfüggvények integrálásához elég lesz logaritmusokkal  bovíteni.  Differenciáltest bovítése Legyen L egy differenciáltest, K



L pedig egy részteste L-nek. Ha a differenciálás nem

vezet ki K-ból, akkor azt mondjuk, hogy K egy differenciálrészteste L-nek, illetve hogy L egy differenciálbovítése  K-nak. Ha valamely f , g



a g logaritmikus R deriváltja, akkor azt írjuk, hogy f ugyanúgy, mint

L-re f

=

0

=

g

0

/g,

azaz ha f deriváltja

log g. (Megjegyezzük, hogy log,

, nem függvény, hanem reláció. Más szóval a log itt egy absztrakt fogalom,

nem pedig egy meghatározott alapú logaritmus függvény.) Ha g



K választható, akkor azt

mondjuk, hogy f logaritmikus K felett. 2.18. példa.

∈RK = Q(x), L = Q(x, = log(x). Ekkor 1/ x d x = log(x).

(1) Legyen g azaz f

=

x

f ), ahol f egy új határozatlan, és legyen f

0

= g0 /g = 1/ x,

74

2. Komputeralgebra

(2) Hasonlóan,

a

Q(



2) x, log(x





Z √

1

2

=

log(x







2



2)

−2 4 4 √  2), log(x + 2) differenciáltestben van. x

2

log(x

+

√ 2)

(3) Mivel

Z

1 x3

+x

= log(x) −

1 2

log(x

1

+ i) −

− i) = log(x) −

log(x

2

 az integrál tekintheto

Q x, log(x), log(x2 + 1)

1 2

log(x

2

+ 1) ,



elemének is és

Q(i) x, log(x), log(x − i), log(x + i)



 lehetoséget   elemének is. Nyilván célszerubb  az elso választani, mert ekkor az alaptest bovítésére nincs szükség.

Hermite módszere Legyen R K egy nulla karakterisztikájú test, f , g Az



K[x] nemnulla és relatív prím polinomok.

f /g integrál kiszámításához Hermite módszerével olyan a, b, c, d

Z

találhatunk, amelyekre

f

ahol deg a

<

c

=

g

Z

a

+

d

b



K[x] polinomokat

,

(2.15)

 deg b és bRnégyzetmentes fopolinom. A c/d racionális függvényt az integrál a/b kifejezést pedig az integrál logaritmikus részének nevezzük.

racionális részének, az

 A módszer elkerüli g-nek a (felbontási testben vagy valamely még bovebb testben) lineáris   még a K felett irreducibilis tényezokre  tényezokre való bontását, sot, való felbontást is.  Nyilván feltehetjük, hogy g fopolinom. Maradékos osztással f deg g, így f /g

=

p

+ h/g.

=

pg

+ h, ahol deg h <

A p polinomrész integrálása triviális. Határozzuk meg g négy-

zetmentes felbontását, azaz keressünk olyan g1 , . . . , gm  relatív prím fopolinomokat, amelyekre gm

,

1 és g



=

K[x] négyzetmentes és páronként 2

g1 g2

· · · gm . m

Bontsunk parciális tör-

tekre (ez euklideszi algoritmussal megvalósítható): h

m X i X hi, j

=

g

i=1

j

,

gi

j=1

ahol minden hi, j foka kisebb, mint gi foka.  lépés ismétlése: ha j A Hermite-redukció a következo

>

R 1, akkor az

j

hi, j /gi integ-

rált egy racionális függvény és egy, az eredetihez hasonló alakú integrál összegére redukáljuk, amelyben j eggyel kisebb. Felhasználva, hogy gi négyzetmentes, azt kapjuk, hogy

0

lnko(gi , gi )

 = 1, így a bovített euklidészi algoritmussal kaphatunk olyan s, t ∈ K[x] polino+ tg0i = hi, j és deg s, deg t < deg gi . Innen parciális integrálással

mokat, amelyekre sgi

Z

hi, j j

Z =

t

Z

· g0i

+

j

gi

gi

gi Z

−t

= (j

s j− 1

j−1

− 1)gi

t

+ (j

Z

0 j−1

− 1)gi

+

s j−1

gi

75

2.4. Szimbolikus integrálás

Z

−t

= (j

− 1)gij−1

+

s

+ t0 /( j − 1) j−1

.

gi

Megmutatható, hogy gyors algoritmusokat választva, ha deg f , deg g járás O M(n) log n



<

n, akkor az el-

darab K testbeli muveletet  igényel, ahol M(n) a legfeljebb n-ed fokú

polinomok szorzásához szükséges muveletek  számának korlátja. Hermite módszerének van olyan változata is, amely elkerüli h/g parciális törtekre bontását. Ha m

= 1, akkor g négyzetmentes. Ha m > 1, akkor legyen ∗

g

∗ 0

Mivel lnko(gm , g gm )

−1 = g1 g22 · · · gm = m−1

= 1, léteznek olyan s, t ∈ sgm

+

g m

gm

.

K[x] polinomok, amelyekre

∗ 0 tg gm

=h.

= g∗ gm -el és parciálisan integrálva m Z Z ∗ 0 h −t s + g t /(m − 1) = + , m−1 m−1 g (m − 1)gm g∗ gm

Mindkét oldalt osztva g

így m-et eggyel csökkentettük. Megjegyezzük, hogy a és c a határozatlan együtthatók módszerével is meghatározhatók (Horowitz módszere). Osztás után feltehetjük, hogy deg f látszik, d

=

2

g2 g3

−1 · · · gm m

és b

=

g1 g2

· · · gm

<

deg g. Mint az algoritmusból

választható. (2.15) differenciálásával az a poli-

nom deg b darab és a c polinom deg d darab együtthatójára, tehát összesen n darab együtthatóra egy lineáris egyenletrendszert kapunk. Ez a módszer általában nem olyan gyors, mint Hermite módszere. Az alábbi algoritmus az x változó adott f /g racionális függvényére elvégzi a Hermiteredukciót. H- ´ ( f , g)

17

← quo( f , g) ← rem( f , g) (g[1], . . . , g[m]) ← N´ (g) j bontsuk (h/g)-t parciális törtekre, számítsuk ki a g[i] -hez tartozó h[i, j] számlálókat rac ← 0 int ← 0 for i ← 1 to m do int ← int + h[i, 1]/g[i] for j ← 2 to i do n ← j while n > 1 0  do s és t meghatározása az s · g[i] + t · g[i] = h[i, j] egyenletbol n ← n−1 n rac ← rac − (t/n)/g[i] 0 h[i, n] ← s + t /n int ← int + h[i, 1]/g[i] R R red ← rac + p+ int

18

return red

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

p

h

76

2. Komputeralgebra

R Ha valamely nulla karakterisztikájú K testre az ahol a, b



a/b integrált akarjuk kiszámítani,

K[x] nem nulla relatív prím polinomok, deg a

<

deg b, b négyzetmentes

 és fopolinom, akkor eljárhatunk úgy, hogy a b polinom L felbontási testében felírjuk b-t

Qn

 alakban: b gyöktényezos

=

a/b

végül integrálunk:

=

Pn

c /(x− k=1 k

Z

a

n X

k ),

k=1

ck log(x−

(x−



k ),

majd L felett parciális törtekre bontunk:

L x, log(x−



k)



Ennek az eljárásnak, mint az 1/(x

+

x) függvény példáján láttuk, a hátránya, hogy az L

1)

, . . . , log(x− ←





b

=



n)

.

k=1 3

  testbovítés foka túl magas lehet. Elofordulhat az is, hogy L foka K felett n!, ami teljesen kezelhetetlen esetekhez vezet. Másrészt az sem világos, hogy kell-e az adott esetben az  alaptestet bovíteni, például az 1/(x

2

− 2)

függvény esetében nem lehet-e az integrálást az

  tétel lehetové   alaptest bovítése nélkül elvégezni. A következo teszi, hogy L testbovítés fokát  legkisebbre válasszuk. a leheto 2.22. tétel (Rothstein–Trager-féle integráló algoritmus). test, a, b



Legyen K nulla karakterisztikájú

K[x] nem nulla relatív prím polinomok, deg a

és fopolinom.  Ha L algebrai bovítése  K-nak, c1 , . . . , ck v1 , . . . , vk



L[x]

\



L

< \

deg b, b négyzetmentes K páronként különbözo, 

L pedig négyzetmentes és páronként relatív prím fopolinomok,  akkor

az alábbiak ekvivalensek:

Z

a

(1)

b

(2) Az r

=

res x (b, a

− yb0 ) ∈

=

k X

ci log vi

,

i= 1

K[y] polinom L felett lineáris tényezokre  bomlik, c1 , . . . , ck

pontosan az r különbözo  gyökei, és vi

=

lnko(b, a



0

ci b ), ha i

=

1, . . . , k. Itt res x az x

határozatlanban vett rezultáns.

R

+ x) d x integrál kiszámításának problémáját. Ebben az esetben  3 2 3 2 x + x, 1 − y(3x + 1) = −4z + 3y + 1 = −(2y + 1) (y − 1) ,

2.19. példa. Tekintsük ismét az r

= res x

amelynek gyökei c1

1/(x

3

= 1 és c2 = −1/2. Így  + x, 1 − (3x2 + 1) = x ,  1 3 2 2 x + x, 1 + (3x + 1) = x + 1 .

v1

=

lnko x

v2

=

lnko

3

2

 o  tétel alapján könnyen felírható integráló algoritmus kicsit javítható: vi Az eloz lnko(b, a



=

0

 kiszámítása helyett vi megci b )-nek (az L test feletti számításokkal történo)

kapható K feletti számítással is, a B algoritmus segítségével.  ´-E- ´ Ezt egymástól függetlenül Trager, illetve Lazard és Rioboo vette észre. Nem nehéz belátni,



hogy az így adódó teljes integráló algoritmus futásideje O nM(n) lg n , ha deg f , deg g 2.23. tétel (Lazard–Rioboo–Trager-formula). mint az r

< n.

Az eloz  o  tétel jelöléseivel, jelölje e a ci -nek

= res x (b, a − yb0 ) polinom gyökének a multiplicitását. Ekkor

77

2.4. Szimbolikus integrálás

(1) deg vi

= e;

∈ K(y)[x] jelöli a b-re és a − yb0 -re K(y)[x]-ben végrehajtott E- ´ -algoritmus e-ed fokú maradékát, akkor vi = w(x, ci ).

(2) ha w(x, y)

B  ´-

Az alábbi algoritmus a Rothstein–Trager-módszer Lazard–Rioboo–Trager-féle javítása. R

Az x változó adott a/b racionális függvényére kiszámítjuk  fopolinom és deg a

a/b-t, ahol b négyzetmentes

< deg b.

L- ´ - ´ (a, b, x)

← res x (b, a − yb0 ), továbbá

1

a szubrezultáns algoritmussal legyen r(y)

2

a számítás során legyen we (x, y) az e-ed fokú maradék

3

(r1 (y), . . . , rk (y))

4

int

5

←0 for i ← 1 to k

6

do if ri (y)

7

,1 ← wi (x, y) együtthatóinak lnko-ja ←B  ´-E- ´ (w(y), ri (y)) wi (x, y) ←P´- ´ (rem(s(y) · wi (x, y), ri (y))) (ri,1 , . . . , ri,k ) ←F(ri ) for j ← 1 to k do d ← deg(ri, j ) c ←M ´ (ri, j (y) = 0, y) if d = 1 then int ← int + c · log(wi (x, c)) else for n ← 1 to d do int ← int + c[n] · log(wi (x, c[n]))

then w(y)

(l(y), s(y), t(y))

8 9 10 11 12 13 14 15 16 17 18

←N´(r(y))

return int

R 2.20. példa. Tekintsük ismét az r

1/(x

2

− 2) d x integrál kiszámításának problémáját. Ebben az esetben

= res x (x2 − 2, 1 − y · 2x) = −8y2 + 1 .

√  Q[x]-ben, így Q bovítése elkerülhetetlen. Az r gyökei ±1/ 8. A Q(y) feletti B  ´-E- ´ -algoritmusból w1 (x, y) = x − 1/(2y), így az integrál Z √ √ 1 1 1 2) − √ log(x + 2) . d x = √ log(x − 2 x −2 8 8

A polinom irreducibilis

2.4.2. Risch integráló algoritmusa  módon, a racionális függvények integrálására talált módszerek általánosíthatók a Meglepo szokásos függvényeket (sin, exp stb.) és inverzeiket tartalmazó kifejezések integrálására.  A komputeralgebra rendszerek meglepoen bonyolult kifejezések integrálását is elvégzik, néha azonban látszólag igen egyszeru  esetekben sem adják meg az integrált, például az

78 R

2. Komputeralgebra

x/(1

+ e x ) d x kifejezést kiértékeletlenül kapjuk vissza, vagy az eredmény nem elemi spe-

ciális függvényt tartalmaz, például az integrállogaritmus függvényt. Ez azért van, mert ezek ki ben az esetekben az integrál nem is fejezheto

zárt alakban”. ”  integrálokra vonatkozó alapveto  eredményt Liouville zárt alakban” kifejezheto ”  algoritmikus módszereket Risch csak 1968-ban fejlesztette ki. 1833-ban találta, a megfelelo Bár a

Elemi függvények A

zárt alakban” megadható függvényeknek azokat a függvényeket szokás tekinteni, ame”  a racionális függvények, az exponenciális és logaritmus függvény, a trigolyek felépíthetok nometrikus és hiperbolikus függvények és inverzeik, valamint gyökvonások, illetve sokkal általánosabban polinom függvények inverzei”, azaz egyenletek gyökeinek képzése segít” ségével, tehát ezen függvények egymásba helyettesítésével. R 1/(1

Észrevehetjük, hogy míg az

+ x2 ) d x integrált arctg(x) alakban szokás megadni,

a racionális törtfüggvény integrálására megadott algoritmus az eredményt

Z

1 1

alakban adja. Mivel

C-ben

+x

2

dx

=

i 2

log(x

+ i) −

i 2

log(x

− i)

 az a trigonometrikus és hiperbolikus függvények kifejezhetok

exponenciális függvény, inverzeik pedig a logaritmus függvény segítségével, csak az ex módon kiderül, hogy az ponenciális és a logaritmus függvényre szorítkozhatunk. Meglepo  integrálok kifejezéséhez (algebrai számokkal való bovítések mellett) itt is csak logaritmu sokkal való bovítésekre van szükség. Exponenciális elemek  Legyen L a K differenciáltest differenciálbovítése. Ha egy hogy

θ0 /θ =

0

u , azaz ha

azt mondjuk, hogy hogy a

θ∈

θ

θ

θ∈

L elemhez van olyan u



K,

logaritmikus deriváltja K valamely elemének a deriváltja, akkor

θ = exp(u). Ha csak az teljesül, θ0 /θ = u, azaz, ha θ logaritmikus deriváltja K

exponenciális K felett, és azt írjuk

L elemhez van olyan u

eleme, akkor azt mondjuk, hogy



K, hogy

θ hiperexponenciális K

felett.

A K felett logaritmikus, exponenciális vagy hiperexponenciális elemek lehetnek algebraiak vagy transzcendensek K felett. Elemi kiterjesztések  Legyen L a K differenciáltest differenciálbovítése. Ha L ahol j

= 1, 2, . . . , n-re θ j

=

K(θ1 , θ2 , . . . , θn )

,

logaritmikus, exponenciális vagy algebrai K j− 1

=

K(θ1 , . . . , θ j−1 )

felett (K0 = K), akkor azt mondjuk, hogy L a K elemi kiterjesztése. Ha j = 1, 2, . . . , n-re θ j transzcendens és logaritmikus vagy transzcendens és exponenciális K j−1 felett, akkor azt mondjuk, hogy L a K transzcendens elemi kiterjesztése. Legyen C(x) a racionális függvények teste C C konstans testtel és a szokásos differenciálással. Ennek egy elemi kiterjesztését elemi függvénytestnek, transzcendens elemi kiterjesztését pedig transzcendens elemi függvénytestnek nevezzük.

79

2.4. Szimbolikus integrálás

= exp(x) + exp(2x) + exp(x/2) függvény f = θ1 + θ2 + θ3 ∈ Q(x, θ1 , θ2 , θ3 ) alakban θ1 = exp(x), θ2 = exp(2x), θ3 = exp(x/2). Nyilván θ1 exponenciális Q(x) felett, θ2 2 exponenciális Q(x, θ1 ) felett és θ3 exponenciális Q(x, θ1 , θ2 ) felett. Mivel θ2 = θ1 , Q(x, θ1 , θ2 ) = Q(θ1 ), 2 így f az egyszerubb  f = θ1 + θ1 + θ3 alakba írható. A θ3 függvény nemcsak exponenciális Q(x, θ1 ) 1/2 1/2 1/2 2 2 felett, hanem algebrai is, mivel θ3 − θ1 = 0, azaz θ3 = θ1 . Így f = θ1 + θ1 + θ1 ∈ Q(x, θ1 , θ1 ). De f

2.21. példa. Az f írható, ahol

még ennél egyszerubb  alakban is felírható: f

2.22. példa. Az

= θ32 + θ34 + θ3 ∈ Q(x, θ3 ) .

q f

=

log(x2

+ 3x + 2)

log(x

+ 1) + log(x + 2)



2 függvény felírható f = θ4 ∈ Q(x, θ1 , θ2 , θ3 , θ4 ) alakban, ahol θ1 = log(x + 3x + 1), θ2 = log(x + 1), θ3 = log(x + 2), θ4 pedig a θ42 −θ1 (θ2 +θ3 ) = 0 algebrai egyenletnek tesz eleget, de sokkal egyszerubben  f = θ1 ∈ Q(x, θ1 ) alakban is.

2.23. példa. Az f

=



exp log(x)/2 függvény felírható f

θ2 = exp(θ1 /2), így θ1 logaritmikus Q(x) felett, θ2 θ22 − x = 0, így θ2 algebrai Q(x) felett, és f (x) = x1/2 .

és

= θ2 ∈ Q(x, θ1 , θ2 ) alakban, ahol θ1 = log(x) Q(x, θ1 ) felett. Azonban

pedig exponenciális

Elemi függvények integrálása  Tetszoleges elemi függvénytestek elemeinek integrálját, ha elemi függvény, a Liouville-elv teljesen jellemezni fogja. Mindazonáltal az algebrai kiterjesztési lépések – ha nem csak a konstansok testét terjesztjük ki – nagy nehézségeket okoznak. Itt csak a transzcendens elemi függvénytestek függvényeinek Risch-algoritmussal tör integrálásával foglalkozunk. téno A gyakorlatban egy

Q(α1 , . . . , αk )(x, θ1 , . . . , θn ) transzcendens elemi függvénytest valaα1 , . . . , αk algebrai számok Q felett, az integrál pedig egy

 van szó, ahol mely elemérol

Q(α1 , . . . , αk , . . . , αk+h )(x, θ1 , . . . , θn , . . . , θn+m ) elemi függvénytest eleme lesz. Elvileg legegyszerubb  lenne a konstansok testét

C-nek vá-

lasztani, de mint a racionális függvények integrálásánál láttuk, ez nem lehetséges, mert csak  bizonyos számtestekben, például algebrai számtestekben tudunk pontosan számolni, sot, igyekeznünk kell az

αk+1 , . . . , αk+h

 legalacsoalgebrai számok számát és fokaikat a leheto

 nyabban tartani. Mindazonáltal a konstansok testének algebrai bovítéseit kezelhetjük dina  elképzelhetjük, hogy már elore   mikusan, a szükségessé váló bovítésekr ol elvégeztük oket,  a gyakorlatban pedig mindig csak akkor hajtjuk végre a bovítést, ha szükségessé válik. Miután a trigonometrikus és hiperbolikus függvények exponenciálisra, inverzeiknek pedig logaritmusra való konverzióját elvégeztük, az integrandust mint egy elemi függvénytest  elemét kapjuk meg. A 2.21. és 2.22. példák mutatják, hogy bár lehet, hogy a függvény elso ” pillantásra” nem tunik  egy transzcendens elemi kiterjesztés elemének, mégis az, a 2.23.  pillantásra” transzcendens elemi kiterelso ”  lépés tehát az, hogy a különbözo  exponenciális jesztés elemének tunik,  mégsem az. Az elso példa pedig azt, hogy lehet, hogy a függvény

80

2. Komputeralgebra

és logaritmikus függvények közötti algebrai kapcsolatok vizsgálatával az integrandust mint  Hogy ez hogyan lehetséges, azzal nem transzcendens elemi függvénytest elemét állítjuk elo.   a Risch-tol  származó struktúra-tétel sefoglalkozunk. Hogy ez sikerült-e, az ellenorizhet o gítségével. A tétel bizonyítását elhagytuk. Szükségünk lesz egy denícióra. Egy

θ elem monomiális a K

differenciáltest felett, ha transzcendens K felett, exponen-

ciális vagy logaritmikus K felett, valamint K-ban és K(θ)-ban ugyanazok a konstansok. 2.24. tétel (struktúra-tétel). Legyen K a konstansok teste és Kn

=

K(x, θ1 , . . . , θn ) egy

differenciál-kiterjesztése K(x)-nek, amelyben a konstansok teste K. Tegyük fel, hogy minden uj

θj



1.

g

= K(x, θ1 , . . . , θ j−1 ) felett, vagy θ j = θ j = u j , ahol u j = exp(w j ) és w j ∈ K j−1 . Ekkor

vagy algebrai K j−1

K j−1 , vagy

= log( f ), ahol

f



Kn

\ K, pontosan akkor monomiális Kn Y k k f · k, k j ∈ Z, k , 0 uj ,

w j , ahol w j

=

log(u j ) és

felett, ha nincs olyan

j

szorzat, amely K-beli; 2.

g

= exp( f ), ahol

f



Kn

\ K, pontosan akkor monomiális Kn felett, ha nincs olyan X f + c jw j, cj ∈ Q

lineáris kombináció, amely K-beli. A szorzatképzés, illetve összegzés csak a logaritmikus és exponenciális lépésekre történik.  tétel. Az egész elmélet legfontosabb, klasszikus eredménye a következo 2.25. tétel (Liouville-elv). Legyen K egy differenciáltest a C konstans testtel. Legyen L egy

0

elemi differenciálkiterjesztése K-nak ugyanazzal a C konstans testtel. Tegyük fel, hogy g f



K. Ekkor léteznek olyan c1 , . . . , cm

f

∈ C konstansok és v0 , v1 , . . . , vm ∈

= v00 +

m X

0

cj j= 1

azaz hogy

Z g

=

f

= v0 +

=

K elemek, hogy

vj vj

,

m X

c j log(v j )

.

j=1

Figyeljük meg, hogy a helyzet hasonló, mint a racionális függvények integrálásánál. A tételt nem bizonyítjuk. Bár a bizonyítás hosszadalmas, az ötlete könnyen elmondható.   Eloször megmutatjuk, hogy egy transzcendens exponenciális bovítést differenciálással nem lehet

kiküszöbölni”, azaz egy racionális függvényét deriválva, abból az új elem nem tunik  ”   elem egy polinomját deriel. Ez azon múlik, hogy a transzcendens exponenciális bovít o válva, a derivált újra az elem egy polinomja lesz, a polinom foka nem változik, és a derivált nem osztható az eredeti polinommal, kivéve, ha az monom volt. Utána megmutatjuk, hogy  algebrai bovítésre nincs szükség az integrál kifejezéséhez. Ez lényegében azon múlik, hogy   elemet a minimálpolinomjába beírva nullát kapunk, és ezt az egyenleaz algebrai bovít o  kifejezheto  a bovít   elem deriváltja, mint az elem tet differenciálva, a kapott egyenletbol o

81

2.4. Szimbolikus integrálás

 racionális függvénye. Végül a transzcendens logaritmikus elemekkel való bovítéseket kell   elem differenciálással pontosan még megvizsgálnunk. Megmutatjuk, hogy egy ilyen bovít o  ki, ha egy konstans együtthatós elsofokú  akkor küszöbölheto polinomja szerepel. Ez azon   elem egy polinomját deriválva, annak egy polinomját kapjuk, múlik, hogy egy ilyen bovít o aminek fokszáma vagy ugyanannyi, mint az eredetié, vagy eggyel kisebb, és ez utóbbi eset  ha a foegyüttható  csak akkor fordulhat elo, konstans. Risch-algoritmus

Q felett, Kn = K(x, θ1 , . . . , θn ) pedig transzcendens elemi függθ = θn jelöléssel egy f (θ)/g(θ) ∈ Kn = Kn−1 (θ) integrálni, ahol Kn−1 = K(x, θ1 , . . . , θn−1 ). (Az n = 0 eset a racionális

Legyen K algebrai számtest

vénytest. Az algoritmus rekurzív n-ben: függvényt fogunk

 függvények integrálása.) Feltehetjük, hogy f és g relatív prímek és g fopolinom. Az x szerinti differenciálás mellett használni fogjuk a

θ

szerinti deriválást is, ezt d /d θ-val jelöljük.

A továbbiakban csak az algoritmusokat ismertetjük. Risch-algoritmus: logaritmikus eset

θ transzcendens u /u, u ∈ Kn−1 . Maradékos osztással f (θ) = p(θ)g(θ) + h(θ), ahonnan Z Z Z f (θ ) h(θ) = p(θ) + . g(θ) g(θ)  o  pont jelöléseivel, eloször  Az eloz feltesszük, hogy

és logaritmikus,

θ0 =

0

A racionális függvények integrálásával ellentétben, most a polinomrész integrálása a nehezebb. Ezért a racionális rész integrálásával kezdjük.

Logaritmikus eset, racionális rész Legyen g(θ)

= g1 (θ)g22 (θ) · · · gm (θ) a g(θ) négyzetmentes felbontása. Ekkor m ! d lnko (g j (θ), g j (θ ) ) = 1 dθ 0  nyilván teljesül. Megmutatható, hogy a jóval erosebb lnko g j (θ), g j (θ) = 1 feltétel is telje-

sül. Parciális törtekre bontással h(θ) g(θ)

=

m X i X hi, j (θ) i= 1

j= 1

gi (θ) j

.

 Hermite-redukciót fogunk használni: a bovített euklidészi algoritmussal kaphatunk olyan s(θ), t(θ)



Kn−1 [θ]

deg s(θ), deg t(θ)

Z

polinomokat,

amelyekre

s(θ)gi (θ)

+

t(θ)gi (θ)

0

=

< deg gi (θ). Innen parciális integrálással

hi, j (θ) j

gi (θ)

Z = = =

Z · gi (θ)0 + gi (θ) j Z −t(θ) + ( j − 1)gi (θ) j−1 Z −t(θ) + ( j − 1)gi (θ) j−1 t(θ)

s(θ) gi (θ) j−1

Z

0

t(θ)

j−1

( j − 1)gi (θ) 0 s(θ) + t(θ) /( j gi (θ) j−1

s(θ)

+ − 1)

gi (θ) j−1

.

hi, j (θ)

és

82

2. Komputeralgebra

> 1, azt kapjuk, hogy Z h(θ) c(θ) a(θ) = + , g(θ) d(θ) b(θ)

Addig alkalmazva ezt az eljárást, amíg j

Z

ahol a(θ), b(θ), c(θ), d(θ)

 ∈ KRn−1 [θ], deg a(θ) < deg b(θ) és b(θ) négyzetmentes fopolinom. a(θ)/b(θ) integrál kiszámítására a Rothstein–Trager-módszer

Megmutatható, hogy az

alkalmazható. Számítsuk ki az r(y)

= resθ

− y · b(θ)0

b(θ), a(θ)



rezultánst. Megmutatható, hogy az integrál pontosan akkor elemi, ha r(y) írható, ahol r(y)



K[y] és s



=

r(y)s alakban

Kn−1 . Ha tehát kiszámítjuk r(y) primitív részét, ezt választjuk

r(y)-nak, és r(y) bármelyik együtthatója nem konstans, akkor nem létezik elemi integrál.  gyökei annak felbontási testében és legyen Egyébként legyenek c1 , . . . , ck az r(y) különbözo vi (θ) ha i

= lnko

b(θ), a(θ)

 − ci b(θ)0 ∈

Kn−1 (c1 , . . . , ck )[θ]

,

= 1, . . . , k. Megmutatható, hogy Z

a(θ) b(θ)

=

k X



ci log vi (θ)

.

i=1

Tekintsünk néhány példát.

R 2.24. példa. Az

1/ log(x) integrál integrandusa 1/θ r(y)

∈ Q(x, θ), ahol θ = log(x)

. Mivel

= resθ (θ, 1 − y/ x) = 1 − y/ x ∈ Q(x)[y]

primitív polinom és van nem konstans együtthatója, az integrál nem elemi.

R 2.25. példa. Az



1/ x log(x) integrál integrandusa 1/(xθ) r(y)

= resθ (θ, 1/ x − y/ x) = 1/ x − y/ x ∈ Q(x)[y],

− y. Ennek = lnko(θ, 1/ x − 1/ x) = θ, így Z

aminek primitív része 1 v1 ( θ )

∈ Q(x, θ), ahol θ = log(x) . Itt

minden együtthatója konstans, így az integrál elemi, c1

1

x log(x)

= c1 log



v1 (θ)

= log

log(x)



=

1,

.

Logaritmikus eset, polinom rész Marad a p(θ)

=

pk θ

k

+ pk−1 θk−1 + · · · + p0 ∈

Kn−1 [θ]

polinomrész integrálásának problémája. A Liouville-elv szerint elemi, ha p(θ)

= v0 (θ)0 +

k X

cj j=1

v j (θ )

0

v j (θ )

,

R

p(θ) pontosan akkor

83

2.4. Szimbolikus integrálás

ahol c j



K és vi



Kn−1 (θ), ha j

 = 0, 1, . . . , m, továbbá KC a K valamely bovítése és Kn−1 =

 K(x, θ1 , . . . , θn−1 ). Meg fogjuk mutatni, hogy K lehet a K egy algebrai bovítése. Hasonlóan érvelve, mint a Liouville-elv bizonyításában, megmutatható, hogy v0 (θ) Kn−1 (azaz független



Kn−1 [θ] és v j (θ)



θ-tól), ha j = 1, 2, . . . , m. Így = v0 (θ)0 +

p(θ)

m X

0

cj j=1

vj vj

.

A Liouville-elv bizonyításánál használt érveléssel azt is megkapjuk, hogy v0 (θ) foka legfeljebb k

+ 1. így ha v0 (θ) = qk+1 θk+1 + qk θk + · · · + q0 , akkor pk θ

k

+ pk−1 θk−1 + · · · + p0 = (qk+1 θk+1 + qk θk + · · · + q0 )0 +

0

m X

cj j=1

vj vj

.

 egyenletrendszert kapjuk: Innen a következo

= = = .. .

0 pk pk−1

= =

p1 p0 ahol az utolsó egyenletben q0

=

q0

0

, + 1)qk+1 θ0 + q0k , 0 0 kqk θ + qk−1 , qk+1 (k

+ q01 , 0 q1 θ + q0 , 2q2 θ

Pm

+

0

0

j= 1

 egyenlet megoldása egyszec j log(v j ). Az elso

 egyenletbe és mindkét oldalt ruen  egy bk+1 konstans. Ezt visszahelyettesítve a következo integrálva azt kapjuk, hogy

Z pk

= (k + 1)bk+1 · θ + qk .

Az integrálási eljárást rekurzív módon alkalmazva pk



Kn−1 integrálja kiszámítható, azon-

ban ez az egyenlet csak akkor oldható meg, ha az integrál elemi, és legfeljebb R egy loga-

θ = log(u). Ha ez nem teljesül, akkor p(θ) nem = ck θ + dk valamely ck ∈ K és dk ∈ Kn−1 -el, ahon = dk + bk egy tetszoleges bk integrációs konstanssal.

 ritmikus bovítést használ és az éppen

R

lehet elemi. Ha ez teljesül, akkor nan bk+1

=

ck+1 /(k

+ 1) ∈

pk

K és qk

 egyenletbe és átrendezve Behelyettesítve qk -t a következo pk−1

− kdk θ0 = kbk θ0 + q0k−1 ,

vagyis mindkét oldalt integrálva

Z  pk−1

− kdk

0

u

u

= kbk θ + qk−1

adódik. A jobb oldalon az integrandus Kn−1 -beli, így az integrációs eljárást rekurzív módon hívhatjuk. Ugyanúgy mint fent, az egyenlet csak akkor oldható meg, ha az integrál elemi,  és legfeljebb egy logaritmikus bovítést használ és az éppen

θ = log(u). Tegyük fel, hogy ez

84

2. Komputeralgebra

teljesül és

Z  pk−1

0

u

− kdk

u

= ck−1 θ + dk−1 ,

∈ K és dk−1 ∈ Kn−1 . Ekkor a keresett megoldás bk = ck−1 /k ∈ K és qk−1 =  + bk−1 , ahol bk−1 egy tetszoleges integrációs konstans. Az eljárást folytatva, az utolsó  elotti egyenlet megoldása b2 = c1 /2 ∈ K és q1 = d1 + b1 valamely b1 integrációs konstanssal.

ahol ck−1 dk−1

Behelyettesítve q1 -et az utolsó egyenletbe, átrendezve, majd integrálva

Z 

p0

0

u

− d1

u

= b1 θ + q0 .

Ez alkalommal csak az a feltétel, hogy az integrál elemi függvény legyen. Ha elemi függvény, mondjuk

Z  p0

akkor b1



− d1

0

u

u

= d0 ∈

Kn−1

,

θ = log(u) együtthatója d0 -ban és q0 = d0 − b1 log(u), az eredmény pedig Z k +1 p(θ) = bk+1 θ + qk θk + · · · + q1 θ + q0 .

K a

Nézzünk néhány példát.

R 2.26. példa.

Az

log(x) integrál integrandusa

θ ∈ Q(x, θ),

ahol

θ =

log(x). Ha az integrál elemi,

Z

akkor

θ = b2 θ2 + q1 θ + q0 0 0 0  = b02 , 1 = 2b2 θ0 + R q1 , 0 = q1 θ + q0 . Az ismeretlen b2 konstanssal a második egyenletbol  1 = 2b2 θ + q1 . Mivel 1 = x + b1 , azt kapjuk, hogy b2 = 0, q1 = x + b1 . A harmadik egyenletbol R R − xθ0 = b1 θ0 +R q00 . Mivel θ0 = 1/ x, integrálva −1 = b1 θ + q0 , és −1 = − x, azt kapjuk, hogy b1 = 0, q0 = − x, így log(x) = x log(x) − x. és 0

R

R 2.27. példa. Az



log log(x) integrál integrandusa

Ha az integrál elemi, akkor

θ2 ∈ Q(x, θ1 , θ2 ), ahol θ1 = log(x) és θ2 = log(θ1 ).

Z θ2 = b2 θ22 + q1 θ2 + q0

 = b02 , 1 = 2b2 θ20 R+ q01 , 0 = q1 θ20 + q00 . Az ismeretlen b2 konstanssal a második egyenletbol  = 2b2 θ + q1 . Mivel 1 = x + b1 , azt kapjuk, hogy b2 = 0, q1 = x + b1 . A harmadik egyenletbol  − xθ20 = b1 θ20 + q00 . Mivel θ20 = θ10 /θ1 = 1/ x log(x) , teljesülnie kell az Z −1 = b1 θ2 + q0

és 0

R

1

log(x)

 egyenloségnek, azonban a 2.24. példából tudjuk, hogy a bal oldalon álló integrál nem elemi.

Risch-algoritmus: exponenciális eset

θ transzcendens és exponenciális, θ0 /θ = f (θ) = q(θ)g(θ) + h(θ), ahonnan Z Z Z h(θ) f (θ ) = q(θ) + . g(θ) g(θ)

Most feltesszük, hogy osztással

0

u , u



Kn−1 . Maradékos

85

2.4. Szimbolikus integrálás

Tervünk az, hogy a racionális részre Hermite módszerét fogjuk alkalmazni. Kellemetlen  g j (θ) függmeglepetés ér azonban bennünket, mert a négyzetmentes felbontásban szereplo vényekre bár lnko (g j (θ),

d dθ

! g j (θ ) )

0

 nyilván teljesül, a jóval erosebb lnko g j (θ), g j (θ)

θ, akkor lnko g j (θ), g j (θ)

0

=1

= 1 feltétel már nem. Például ha g j (θ) =

= lnko(θ, u0 θ) = θ .

Megmutatható azonban, hogy ez a kellemetlen jelenség nem lép fel, ha

0

már lnko g j (θ), g j (θ)

=

1. Elég tehát, ha a

θ

θ 6|

g j (θ), ekkor

 eltávolítjuk a nevezob  ol.  Legyen tényezot

= θ` g(θ), ahol már θ 6 | g(θ), és keressünk olyan h(θ), s(θ) ∈ Kn−1 [θ] polinomokat, ` amelyekre h(θ)θ + t(θ)g(θ) = h(θ), deg h(θ) < deg g(θ) és deg s(θ) < `. Mindkét oldalt osztva g(θ)-val azt kapjuk, hogy g(θ)

f (θ( g(θ) A p(θ)

= q(θ) + t(θ)/θl jelöléssel

= q(θ) +

t(θ)

θl

+

h(θ) g(θ)

.

p(θ) véges Laurent-sor, ennek integrálása azonban semmi-

 ha meggondoljuk, vel sem lesz nehezebb, mint egy polinom integrálása. Ez nem meglepo, hogy

θ−1 =

exp(−u). Még így is, itt is a

kezdjük.

polinomrész” integrálása a nehezebb. A másikkal ”

Exponenciális eset, racionális rész Legyen g(θ) lnko

= g1 (θ)g22 (θ) · · · gm (θ) a g(θ) négyzetmentes m 0 g j (θ), g j (θ) = 1. Parciális törtekre bontással h(θ) g(θ)

=

m X i X hi, j (θ) i= 1

j= 1

gi (θ) j

felbontása. Ekkor

θ 6|

g j (θ) miatt

.

A Hermite-redukció ugyanúgy megy, mint a logaritmikus résznél. Azt kapjuk, hogy

Z

h(θ) g(θ)

=

c(θ) d(θ)

Z +

a(θ) b(θ)

,

 ahol a(θ), b(θ), c(θ), d(θ) ∈ Kn−1 [θ], deg a(θ) < deg b(θ) és b(θ) négyzetmentes fopolinom, θ 6 | b(θ). R Megmutatható, hogy az a(θ)/b(θ) integrál kiszámítására a Rothstein–Trager-módszer alkalmazható. Számítsuk ki a r(y)

= resθ

b(θ), a(θ)

− y · b(θ)0



rezultánst. Megmutatható, hogy az integrál pontosan akkor elemi, ha r(y) írható, ahol r(y)



K[y] és s



=

r(y)s alakban

Kn−1 . Ha tehát kiszámítjuk r(y) primitív részét, ezt választjuk

r(y)-nak, és r(y) bármelyik együtthatója nem konstans, akkor nem létezik elemi integrál.  gyökei annak felbontási testében és legyen Egyébként legyenek c1 , . . . , ck az r(y) különbözo v i (θ )

= lnko

b(θ), a(θ)

 − ci b(θ)0 ∈

Kn−1 (c1 , . . . , ck )[θ]

,

86 ha i

2. Komputeralgebra

= 1, . . . , k. Megmutatható, hogy  k  Z k  X  X a(θ) = − ( ci deg vi (θ)) + ci log b(θ) i=1 i=1

vi (θ)



.

Nézzünk néhány példát.

R 2.28. példa. Az

 + exp(x) integrál integrandusa 1/(1 + θ) ∈ Q(x, θ), ahol θ = exp(x). Mivel

1/ 1

r(y)

= resθ (θ + 1, 1 − yθ) = −1 − y ∈ Q(x)[y]

primitív polinom és csak konstans együtthatói vannak, az integrál elemi, c1 1, 1

+ θ) = 1 + θ, így Z 1

R 2.29. példa. Az

1

+ exp(x)

x/ 1

= −c1 x deg v1 (θ) + c1 log

+ exp(x) r(y)



v1 (θ)

integrál integrandusa x/(1



= x − log

= −1,

exp(x)

v1 ( θ )

=

lnko(θ

+

 +1 .

+ θ) ∈ Q(x, θ), ahol θ = exp(x). Mivel

= resθ (θ + 1, x − yθ) = − x − y ∈ Q(x)[y]

primitív polinom, amelynek van nem konstans együtthatója, az integrál nem elemi.

Exponenciális eset, polinom rész Marad a p(θ)

=

k X

pi θ

i



Kn−1 (θ)

i=−`

R

polinomrész” integrálásának problémája. A Liouville-elv szerint ” elemi, ha p(θ)

= v0 (θ)0 +

m X

cj j=1

ahol c j Kn−1

=



K és v j



Kn−1 (θ), ha j

= 0, 1, . . . , m,

v j (θ )

p(θ) pontosan akkor

0

v j (θ )

,

 továbbá KC a K valamely bovítése és

 K(x, θ1 , . . . , θn−1 ). Megmutatható, hogy K lehet a K egy algebrai bovítése. Ha-

sonlóan érvelve, mint a Liouville-elv bizonyításában, megmutatható, hogy az általánosság megszorítása nélkül feltehetjük: v j (θ) vagy Kn−1 eleme (azaz független  fopolinom és irreducibilis Kn−1 [θ]-ban, ha j

= 1, 2, . . . , m.

θ-tól)

vagy pedig

Továbbá az is belátható, hogy

  mivel egy ilyen tényezo  megmaradna a v0 (θ) nevezojében nem lehet nem monom tényezo,  derivált nevezojében is. Hasonlóan v j (θ)-nak ( j

= 1, 2, . . . , m)

sem lehet nem monom té-

 nyezoje. Így azt kapjuk, hogy v j (θ) vagy Kn−1 eleme, vagy pedig v j (θ)  egyetlen irreducibilis monom, amely fopolinom. Ha azonban v j (θ) tag az összegben c j v j (θ)

0

= θ, mivel ez az = θ, akkor a megfelelo

 azt kapjuk, hogy /v j (θ) = c j u0 , ami beolvasztható v0 (θ)0 -be. Ebbol

ha p(θ)-nak van elemi integrálja, akkor

  k 0 m X   X vj 0 j     , cj q j θ ) + p(θ) = (   vj j=−`

j=1

87

2.4. Szimbolikus integrálás

ahol q j , v j



Kn−1 és c j



 összegben meg kell K; az, hogy az összegzési határok az elso

  összegzési határokkal, következik abból, hogy egyezzenek a p(θ) eloállításában szereplo j

0

(q j θ )

= (q0j +

0

ju g j )θ

j

.

Az együtthatók összehasonlításával a

pj p0

0

= =

0 q0

=

0

ju q j ,

= q0 +

egyenletrendszert kapjuk, ahol q0 szeruen  q0

+ ,

qj

R

ha

Pm

j=1

−` ≤ j ≤ k, j , 0 ,

c j log(v j ). A p0

R

p0 ; ha ez az integrál nem elemi, akkor

,

akkor meghatároztuk q0 -at. A j

= q00 egyenlet megoldása egy-

p(θ) sem elemi, ha viszont elemi,

0 esetben egy differenciálegyenletet kell megoldanunk

q j meghatározásához, az úgynevezett Risch-differenciálegyenletet. A differenciálegyenlet

0

y

+

fy

=

g alakú, ahol az adott f , g függvények Kn−1 elemei és Kn−1 -beli megoldásokat

 pillantásra úgy tunik, keresünk. Elso  hogy az integrálás problémáját egy nehezebb problémával helyettesítettük, azonban az, hogy az egyenletek lineárisak, a megoldásnak pedig Kn−1 -ben kell lenni, sokat R segít. Ha valamelyik Risch-differenciálegyenletnek nincs Kn−1 p(θ) nem elemi, egyébként

beli megoldása, akkor

Z p(θ)

=

X

q jθ

j

+ q0 .

j,0

A Risch-differenciálegyenlet algoritmussal megoldható, ezt nem részletezzük. Tekintsünk néhány példát.

R

exp(− x ) integrál integrandusa

R

akkor

θ=

q1 θ, ahol q1

R

megoldása, így

exp(− x ) nem elemi. 2

R 2.31. példa. Az

θ ∈ Q(x, θ), ahol θ = exp(− x2 ). Ha az integrál elemi, ∈ C(x). Nem nehéz belátni, hogy a differenciálegyenletnek nincs racionális 2

2.30. példa. Az

x

x integrál integrandusa exp (x log(x)

R



= θ2 ∈ Q(x, θ1 , θ2 ), ahol θ1 = log(x) és θ2 =

exp(xθ1 ). Ha az integrál elemi, akkor θ2 = q1 θ2 , ahol q1 ∈ C(x, θ1 ). Mindkét oldalt differenciálva θ2 = q01 θ2 + q1 (θ1 + 1)θ2 , ahonnan 1 = q01 + (θ1 + 1)q1 . Mivel θ1 transzcendens R C(x) felett, az együtthatók 0 x összehasonlításával 1 = q1 + q1 és 0 = q1 , aminek nincs megoldása. így x nem elemi.

2.32. példa. Az

Z

(4x

2

+ 4x − 1)

2

exp(x ) (x



+1

2

exp(x )



−1

+ 1)2

integrál integrandusa

+ 4x − 1 2 (θ − 1) ∈ Q(x, θ) , (x + 1)2 R 2 2 ahol θ = exp(x ). Ha az integrál elemi, akkor f (θ) = q2 θ + q0 alakú, ahol f (θ)

=

0 q2

4x

2

+ 4xq2

=

4x

2

+ 4x − 1 , + 1)2

(x

88

2. Komputeralgebra

0 q0

=



4x

2

+ 4x − 1 . + 1)2

(x

 egyenletnek megoldása q2 A második egyenlet integrálható, és q0 elemi. Az elso

Z

f (θ)

=

1 x

2

+1

2

exp (x )



(2x x

+ 1) + 4 log(x + 1) . +1

Gyakorlatok 2.4-1. Alkalmazzuk a Hermite-redukciót az alábbi f (x) f (x)

=

441x

7

= 1/(1 + x). Innen

2

∈ Q(x) függvényre:

+ 780x6 − 286x5 + 4085x4 + 769x3 + 3713x2 − 43253x + 24500 . 9x6 + 6x5 − 65x4 + 20x3 + 135x2 − 154x + 49 R

2.4-2. Számítsuk ki az

f (x)

=

36x

6

f integrált, ahol

+ 126x5 + 183x4 + 13807/6x3 − 407x2 − 3242/5x + 3044/15 ∈ Q(x) . (x2 + 7/6x + 1/3)2 (x − 2/5)3

2.4-3. Alkalmazzuk a Risch-algoritmust az alábbi integrál kiszámítására:

Z

x(x

2

2

+ 1){(x2 e2x − log(x + 1)2 ) + 2xe3x (x − (2x3 + 2x2 + x + 1) log(x + 1))} dx . 2 ((x + 1) log (x + 1) − (x3 + x2 )e2x )2 2

2.5. Elmélet és gyakorlat A fejezet eddigi részében arra törekedtünk, hogy néhány lényeges szimbolikus algoritmus bemutatásán keresztül érzékeltessük a komputeralgebra tudományterületének algoritmuster  o  Olvasó áttekintést kaphat a szimbolikus vezési problémáit. A következokben az érdeklod algoritmusok kutatásának szélesebb világából.

2.5.1. Egyéb szimbolikus algoritmusok A fejezetben bemutatott rezultánsmódszer és a Gröbner-bázis elmélet mellett létezik algo ritmus nemlineáris egyenletek és egyenlotlenségek valós szimbolikus gyökeinek meghatározására is (Collins). Figyelemre méltó algoritmusok születtek differenciálegyenletek szimbolikus megoldásainak

vizsgálata

során.

A

Risch-algoritmushoz

hasonló

döntési

eljárás

létezik

racionálisfüggvény-együtthatójú homogén másodrendu  közönséges differenciálegyenletek zárt alakú megoldásainak kiszámítására. Magasabb rendu  lineáris esetben az Abramoveljárás a polinomegyütthatós egyenletek zárt racionális megoldásait, a Bronstein-algoritmus R pedig az exp(

f (x)d x) alakú megoldásokat határozza meg. Parciális differenciálegyenletek

esetében a Lie-féle szimmetria-módszerek állnak rendelkezésre. Létezik algoritmus formális hatványsorok és racionális függvények feletti lineáris differenciáloperátorok faktorizálására is.

89

2.5. Elmélet és gyakorlat

 A faktorizáláson alapuló eljárások komoly jelentoséggel bírnak a komputeralgebrai algoritmusok kutatásában. Olyannyira igaz ez a megállapítás, hogy sokan az egész tudományterület születését Berlekamp azon publikációjától számítják, amelyben hatékony algoritmust ad kis p karakterisztikájú véges testek feletti egyhatározatlanú polinomok faktorizációjára.  Berlekamp eredményét késobb nagyobb p karakterisztikákra is kiterjesztette. Azért, hogy  kapjon, az algoritmusába véletlen elemeket illesztett. A mai kompuhasonlóan jó futási idot teralgebra rendszerek nagyobb véges testekre is rutinszeruen  alkalmazzák Berlekamp eljá rását talán anélkül, hogy a felhasználók többségének az algoritmus valószínuségi  eredetérol tudomása lenne. A módszer könyvünk második kötetében kerül ismertetésre. Megjegyezzük, hogy véges testek feletti polinomok faktorizálására számos algoritmus létezik. Nem sokkal azután, hogy a véges testek feletti polinomfaktorizáció megoldódott, Zassenhaus van der Waerden 1936-os Moderne Algebra könyvét alapul véve a p-adikus számok aritmetikájának ún. Hensel-lemmáját alkalmazta a faktorok kiterjesztésére. A Hensel” lifting” – ahogy ma az eljárását nevezik – általános megközelítési módszer arra, hogyan  Az interpolációval ellentétben, ami több rekonstruáljuk a faktorokat moduláris képeikbol. képpont meglétét követeli meg, a Hensel-lifting kiindulásul csak egyetlen képpontot igényel. Az egész együtthatós polinomok faktorizációjára adott Berlekamp–Zassenhaus-féle  jelentoség  algoritmus alapveto u,  mégis rejteget magában két csapdát. Az egyik, hogy bizonyos fajta polinomokra az algoritmus futási ideje exponenciális. Sajnos, az algebrai szám A másorossz” polinom kerül elo. ” dik, hogy többváltozós polinomokra hasonló reprezentációs probléma lép fel, mint amilyet

testekre épített polinomok faktorizációjánál sok ilyen

 problémát egy, a számok georitka mátrixok Gauss-eliminációjánál tapasztalunk. Az elso metriáján alapuló diofantoszi optimalizálás, a Lenstra–Lenstra–Lovász nevével fémjelzett ún. rácsredukciós algoritmus oldotta meg, amit a Berlekamp-módszerrel együtt használnak. Ezen polinomiális algoritmus mellé még egy olyan eljárás társul, amely arról gondoskodik,  induljon és megfelelo  idoben”  jó” moduláris képrol véget érjen. ” ” A többváltozós polinomfaktorizáció említett reprezentációs problémájára is születtek meghogy a Hensel-lifting

oldások. Ez a második olyan terület, ahol a véletlenítés kritikus szerepet kap a hatékony algoritmusok tervezésében. Megjegyezzük, hogy a gyakorlatban a Berlekamp–Zassenhaus– Hensel-féle algoritmus hatékonyabban muködik,  mint a Lenstra–Lenstra–Lovász-féle eljárás.

 Összevetésképpen a polinomfaktorizálás problémája tehát polinomiális idoben meg-

e oldható, míg az N egész faktorizálására a bizonyítottan legjobb algoritmikus korlát O(N (Pollard és Strassen) a determinisztikus, és L(N) √ ségi esetben, ahol L(N)

=e

ln N ln ln N

1+o(1)

1/4

)

(Lenstra és Pomerance) a valószínu

.

 Valójában a heurisztikus, valószínuségi  módszereknek egy új elmélete van születoben a komputeralgebrában egyrészt az számítási tárrobbanás elkerülésére, másrészt a determinisztikusan nagy futási ideju  algoritmusok hatékonyságának növelésére. A valószínuségi  al muködésnek goritmusok esetében a nem megfelelo  is van pozitív valószínusége,  ami vagy az esetleges rossz válaszban nyilvánul meg (Monte Carlo csoport), vagy, habár sohasem  hogy polinomiális idoben  kapunk rossz választ (Las Vegas csoport), elképzelheto, nem kapunk semmit. A már említetteken kívül heurisztikákkal szép eredményeket értek el többek között polinomazonosság tesztelésénél, polinomok irreducibilitásának vizsgálatánál, mátrixok normálformáinak (Frobenius, Hilbert, Smith) meghatározásánál.

Szerepük minden

 valószínuség  szerint a jövoben is növekedni fog. A fejezet eddigi részében a lényegesebb szimbolikus algoritmusokat tekintettük át. Már  a bevezetoben említettük, hogy a komputeralgebra-rendszerek többsége képes numerikus

90

2. Komputeralgebra

 számítások elvégzésére is: a hagyományostól eltéroen a számítási pontosságot a felhasználó  határozhatja meg. Gyakran elofordul, hogy a szimbolikus és numerikus számításokat együtt célszeru  használni. Tekintsük például egy differenciálegyenlet szimbolikusan kiszámolt hatványsor megoldását. A csonkított hatványsort ezután bizonyos pontokban a szokásos lebe gopontos aritmetikával kiértékelve a differenciálegyenlet megoldásának numerikus approximációját kapjuk. Amennyiben a megoldandó probléma valamilyen valós zikai probléma  approximációja, a szimbolikus számítások vonzó lehetoségei gyakran érvényüket vesztik; egyszeruen  mert túl bonyolultak vagy túl lassúak ahhoz, hogy hasznosak vagy szükségesek legyenek, hiszen a megoldást is numerikusan keressük. Más esetekben, ha a probléma szimbolikusan kezelhetetlen, az egyetlen lehetséges út a numerikus approximációs módsze ha a létezo  szimbolikus algoritmus nem talál zárt rek használata. Ilyen akkor fordulhat elo, megoldást (pl. nem elemi függvények integrálja stb.), vagy nem létezik a problémát kezelni tudó szimbolikus algoritmus. Ámbár egyre több numerikus algoritmusnak létezik szimboli kus megfeleloje, a numerikus eljárások nagyon fontosak a komputeralgebrában. Gondoljunk csak a differenciál- és integrálszámítás területére: bizonyos esetekben a hagyományos algoritmusok – integráltranszformációk, hatványsor-approximációk, perturbációs módszerek –  lehetnek a legcélravezetobbek.  A komputeralgebra algoritmusok tervezésénél a jövoben egyre nagyobb szerepet kap algoritmus nak a párhuzamos architektúrájú számítógépek. Habár sok meglévo

ránézésre” ” párhuzamosítható, nem biztos, hogy a jó szekvenciális algoritmusok párhuzamos architek eljárással érheto  túrákon is a legjobbak lesznek: az optimum talán egy teljesen különbözo el.

2.5.2. A komputeralgebra-rendszerek áttekintése  A komputeralgebra-rendszerek fejlodésének története szoros kapcsolatban áll az informa  tika és az algoritmikus matematika fejlodésével. A számítástechnika kezdeti idoszakában  tudományterületek muvel  szimbolikus számítási igényeik megkönnyítése és a különbözo  oi  komputeralgebra-rendszereket, amefelgyorsítása érdekében kezdték el fejleszteni az elso lyek átdolgozva, folyamatosan megújulva és a sokadik változatban napjainkban is jelen vannak. A hetvenes években jelentek meg az általános célú komputeralgebra-rendszerek, amelyeket beépített adatstruktúrák, matematikai függvények és algoritmusok széles tárháza  számítógéjellemez, minél nagyobb felhasználói területet próbálva meg lefedni. A jelentos  pes eroforrásigény miatt robbanásszeru  elterjedésük a nyolcvanas évek elejére, a mikropro A jobb hardver környezet, a cesszor alapú munkaállomások megjelenésének idejére teheto.  hatékonyabb eroforrás-gazdálkodás, rendszerfüggetlen, magasszintu  alapnyelv használata, és nem utolsósorban a társadalmi-gazdasági igények fokozatosan piaci termékké érlelték az  javulást hozott a felhasználói általános célú komputeralgebra-rendszereket, ami viszont eros felület és dokumentumkészítés terén. Az alábbiakban a legismertebb általános és speciális célú komputeralgebra rendszereket, könyvtárakat soroljuk fel.



Általános célú komputeralgebra rendszerek: A, D, F, GNU-, J, M, M, M, D M, MCAD, M S M T, S, MAS, M, M, M-M, MPAD, R, R.

91

2. Feladatok



Algebra és számelmélet: B, CCA, F, F, GRB, K, M, M, N, P, S, S.

• • •

Algebrai geometria: C, G. Csoportelmélet: G, LE, M, S. Tenzor analízis: C, FC, GRG, GRT, MT, RT, R, TTC.



Komputeralgebra könyvtárak: A, BN, GNU MP, K, LDA, NTL, S, U, W, Z.

Az általános célú komputeralgebra rendszerek többsége olyan tulajdonságokkal bír, mint

• • •

interaktivitás, matematikai tények ismerete, 2

matematikai objektumok kezelésére képes deklaratív , magas szintu  programozási  nyelv funkcionális programozási lehetoségekkel,

• • • • • • •

 az operációs rendszer és más programok felé való kiterjeszthetoség, szimbolikus és numerikus számítások integrálása, automatikus (optimalizált) C és Fortran kódszegmens generálása, grakus felhasználói környezet, 2 és 3 dimenziós graka, animáció, AT X konverzió,  szövegszerkesztési lehetoség és automatikus L E

on-line súgó.

A komputeralgebra-rendszereket matematikai szakértoi  rendszereknek is nevezik. Nap iramú fejlodésének  jainkban az általános célú komputeralgebra-rendszerek szédíto lehe  tünk szemtanúi, elsosorban tudásuknak és széles köru  alkalmazhatóságuknak köszönhetoen. Mégis hiba volna alábecsülni a speciális rendszereket, amelyek egyrészt igen fontos szerepet  és hatékojátszanak sok tudományterületen, másrészt sok esetben könnyebben kezelhetok nyabbak, jelölésrendszerük és algoritmusaik alacsony szintu  programnyelvi implementációja miatt. Nagyon lényeges, hogy egy adott probléma megoldásához az arra legalkalmasabb komputeralgebra-rendszert válasszuk ki.

Feladatok 2-1. Maradékos osztás maradéksorozata együtthatói hosszának vizsgálata Generáljunk két (n

=

10)-ed fokú pszeudovéletlen polinomot

Z[x]-ben

l

=

10 decimális

 álló együtthatókkal. Hajtsunk végre egyetlen maradékos osztást (Q[x]-ben) és szájegybol mítsuk ki a maradék polinom és az eredeti polinom (λ függvénnyel meghatározott) maximális együtthatóhosszának arányát. Ismételjük meg a számításokat (t

= 20)-szor és számítsunk = 100, 500, 1000 ese-

átlagot. Mennyi lesz a kapott érték? Ismételjük meg a fenti kísérletet l tén.

2

 utat, mint ahogy A deklaratív programozási nyelvek a kívánt eredményt specikálják és nem a hozzájuk vezeto

az imperatív nyelvek teszik.

92

2. Komputeralgebra

2-2. M --´ algoritmus szimulációs vizsgálata ´ Szimulációs vizsgálattal adjunk becslést a M --´ algoritmusban az ´  fokszám és n változó optimális értékére. Használjunk véletlen polinomokat különbözo együttható-nagyság esetén. 2-3. Módosított pszeudo-maradékos osztás Legyen f , g

∈ Z[x],

deg f

=

m



n

=

deg g. A pszeudo-maradékos osztást módosítsuk oly

módon, hogy a s

gn f

= gq + r

= m − n + 1 kitevo helyett a leheto legkisebb olyan s ∈ N érték szerepeljen, ∈ Z[x]. Az így származtatott spquo() és sprem() eljárásokkal helyettesítve a P´-E algoritmus pquo() és prem() eljárásait véletlen polinomokat alkalmazva

egyenletnél az s amellyel q, r

vessük össze az algoritmusok tárigényét. 2-4. Redukált Gröbner-bázis konstrukciója  Tervezzünk algoritmust, amely adott G Gröbner-bázisból redukált Gröbner-bázist állít elo. 2-5. A Hermite-redukció megvalósítása Valósítsuk meg a Hermite-redukciót valamilyen választott komputeralgebra nyelven. 2-6. Racionális törtfüggvény integrálása Írjunk programot a racionális törtfüggvények integrálására.

Megjegyzések a fejezethez A K-E és B  ´-E algoritmusok nemnegatív egész beme változata megtalálható [90]-ben. A rezultánsok elméletének természenet esetén muköd  o tes folytatásaként juthatunk el a szubrezultánsokhoz, melynek segítségével a B  ´E algoritmus során látott együttható-növekedés jól kordában tartható (lásd például [152, 480]). A Gröbner-bázisokat B. Buchberger vezette be 1965-ben [62]. Polinomideálok bázisa is foglalkozott ezt megeloz  oen.  ival több szerzo A legismertebb talán Hironaka, aki 1964ben

C

feletti szingularitások feloldására hatványsorok ideáljainak bázisát használta. Mun-

kájáért Fields-érmet kapott. Azonban Hironaka módszere nem volt konstruktív. A Gröbnerbázisokat az utóbbi két évtizedben számos algebrai struktúrára általánosították. A differenciálalgebra alapjait J. F. Ritt fektette le 1948-ban [389]. A szimbolikus integrálás során használt négyzetmentes felbontás algoritmusa megtalálható például [480, 152]   legkisebbre választásának könyvekben. A Hermite-redukcióban a testbovítés foka leheto fontosságát igazolja a [152]-ben található 11.11. példa, amelyben a felbontási test rendkívül  magas fokú, míg az integrál egy másodfokú testbovítésben felírható. A Rothstein–Tragerféle integráló algoritmus bizonyítása megtalálható [480]-ben (22.8. tétel). Megjegyezzük, hogy az algoritmust Rothstein és Trager egymástól függetlenül találták. A Lazard–Rioboo– Trager-formula helyességének bizonyítása, a L- ´ - ´ algoritmus futási idejének elemzése, az algebrai kiterjesztési lépések nehézségének kezelésével kapcsolatos eljárások vázlatos ismertetése, a C(x) felett hiperexponenciális elem hiperexponenciális integráljának meghatározása (ha ilyen létezik), a Liouville-elv bizonyítása, a Rischalgoritmussal kapcsolatos állítások bizonyításai megtalálhatók a [480] könyvben.  számos publikáció és A komputeralgebráról és a kapcsolódó tudományterületekrol

2. Megjegyzések a fejezethez

93

 el. Angolul az érdeklod  oknek  könyv született. Magyar nyelven [90], [171] és [264] érheto az összefoglaló matematikai jellegu  munkák közül felsorolunk néhányat: Caviness [71], Davenport és társai [100], von zur Gathen és társai [480], Geddes és társai [152], Knuth [258, 259, 260], Mignotte [328], Mishra [334], Pavelle és társai [362], Winkler [498].  o  Olvasó további információt taA komputeralgebra informatikai oldaláról az érdeklod lálhat az alábbiakban: Christensen [75], Gonnet és Gruntz [164], Harper és társai [193], valamint a világhálón. Az alkalmazásokról könyvek és cikkek nagyon széles választéka áll rendelkezésre, pl. Akritas [8], Cohen és társai (ed.) [85, 86], Grossman (ed.) [179], Hearn (ed.) [198], Kovács [263] és Odlyzko [352].  lásd pl. Karian [239] és A komputeralgebra-rendszerek oktatásban betöltött szerepérol Uhl [472] munkáját. Konferencia kiadványok: A, D, E, E, I és S. Komputeralgebra folyóiratok: Journal of Symbolic Computation – Academic Press, Applicable Algebra in Engineering, Communication and Computing – Springer-Verlag, S-

 Bulletin – ACM Press. Az Eötvös Loránd Tudományegyetem Informatikai Karának Komputeralgebra Tanszéke az oktatásban a [152, 328, 480, 498] munkákat veszi alapul.

3. Kriptográfia

 probléEbben a fejezetben a kriptográában használatos protokollokat, valamint alapveto  egyik alaphelyzetet látmákat és algoritmusokat mutatunk be. A kriptográában jellemzo hatjuk a 3.1. ábrán. Aliz és Bob híreket cserélnek valamilyen nem biztonságos csatornán,  számítógép közötti például nyilvános telefonvonalon, vagy két hálózati kapcsolatban lévo elektronikus posta segítségével. Erik megcsapolja a vezetéket, és lehallgatja a kommunikációt. Mivel Aliz és Bob tudják ezt, a küldeményeiket rejtjelezik.

Erik

3.1. ábra. A kriptográában tipikus alaphelyzet.

A 3.1. alfejezetben olyan szimmetrikus kriptográai rendszereket mutatunk be, amelyek az illetéktelen rejtjelfejtést hivatottak akadályozni. Szimmetrikusnak akkor nevezünk egy kriptográai rendszert, ha ugyanaz a kulcs használható rejtjelezésre (sifrírozásra) és visszafejtésre (desifrírozásra) is. Vajon hogyan kell Aliznak és Bobnak egy közös kulcsban megegyeznie, ha csupán egy megbízhatatlan csatornán tudnak kommunikálni egymással? Ha például Aliz választ egy kulcsot és rejtjelezi (mondjuk egy szimmetrikus rejtjelrendszerrel), majd elküldi Bobnak, azonnal felmerül a kérdés, milyen kulcsot használjanak ezeknek a kulcsoknak a rejtjelezéséhez.  kérdés – amely egy kicsit emlékeztet arra a másikra, hogy vajon Ez a paradoxnak tun  o  a tojás, vagy a tyúk volt-e elobb – kulcscsere-problémaként ismert. A kriptográa kezde megoldhatatlannak tartották ezt a problémát. Annál nagyobb volt a meglepetés, amitétol kor Whiteld Diffie és Martin Hellman 1976-ban megoldották. Egy protokollt javasoltak, amelyben Aliz és Bob információkat cserélnek, s ennek segítségével végül ki tudják számí tani a közös kulcsukat. Az oket lehallgató Eriknek ugyanakkor fogalma sincs a kulcsukról,  minden egyes bitet el tudja fogni. A 3.2. alfemég akkor sem, ha az adatcserében résztvevo jezet bemutatja a Diffie–Hellman-protokollt.

95

3.1. Alapok

A történet némileg ironikus része az, hogy éppen ez a protokoll, amely a szimmetrikus kriptográában oly fontos kulcscsere megoldhatatlannak tartott problémáját megoldotta,  egyengette az utat, s ez utóbbiban a megbízhatatlan egy másik protokoll felfedezése elott  titkos kulcscsere már semmilyen szerepet nem játszik. Diffie és Hellman csatornán történo 1976-ban megjelent munkájukkal kaput nyitottak a modern nyilvános kulcsú kriptográ ának, és már két évvel késobb, 1978-ban, Rivest, Shamir és Adleman szélesre tárták ezt a  nyilvános kulcsú kriptokaput, amikor megalkották jól ismert RSA-rendszerükkel az elso rendszert. A 3.3. alfejezetben szerepel az RSA-rendszer, valamint egy, az RSA-n alapuló digitális aláírásra vonatkozó protokoll. Egy ilyen protokollal Aliz el tudja látni kézjegyével   Bobnak küldött üzeneteit úgy, hogy Bob az üzenet küldojének azonosságát ellenorizni tudja. A digitális aláírások célja annak megakadályozása, hogy Erik Aliz üzenetét meghamisítva úgy tegyen, mintha azt Aliz küldte volna. A Diffie–Hellman-protokoll biztonsága azon a feltételezésen alapszik, hogy a diszkrét logaritmus nem számítható ki hatékonyan. A moduláris hatványozás – amelynek inverz függvénye a diszkrét logaritmus – egy lehetséges egyirányú függvény. Az RSA biztonsága is egy probléma feltételezett nehézségén nyugszik, nevezetesen azon a feltételezésen, hogy  szorzatára. A jogos címzett – Bob nagy számok nem bonthatók hatékonyan prímtényezok – ugyanakkor képes hatékonyan visszafejteni a rejtjelezett üzenetet, miközben egy általa választott szám faktorizációját saját

csapóajtó” információjaként használja fel. ” A 3.4. alfejezetben bemutatunk egy Rivest–Sherman-protokollt, amelyik az úgyneve-

 zett erosen nem invertálható, asszociatív egyirányú függvényeken nyugszik, és a Diffie– Hellman-protokollhoz hasonlóan titkos kulcscserére szolgál. Ez a protokoll is módosítható oly módon, hogy digitális aláírás számára használható legyen. Végül a 3.5. alfejezet az interaktív bizonyításrendszerek és a zéró-ismeretu  protokollok érdekes területére vezet, amely a kriptográában gyakorlati felhasználásra kerül, nevezetesen a hitelesség problémájának megoldása során. Bemutatunk egy zéró-ismeretu  protokollt a grázomorzmus problémára. Másrészt ez a terület a bonyolultságelmélethez is kapcso lódik, és ezért a 4. fejezetben újból elokerül, ismét a grázomorzmus problémával kapcsolatban.

3.1. Alapok  muvészet A kriptográa évezredek óta létezo  és tudomány, írások és üzenetek titkos  olyan rejtjelezésével foglalkozik, amely illetéktelen személyek számára anyagba történo akadályozza a visszafejtést. Ebben az alfejezetben két klasszikus szimmetrikus kriptorend alfejezetekben pedig a manapság használatos legfontosabb szert mutatunk be, a következo protokollok és aszimmetrikus kriptorendszerek közül foglalkozunk néhánnyal. Protokol közötti párbeszédet értünk, miközben egy résztvevo  lehet egy lon két vagy több résztvevo ember, de lehet egy számítógép is. A kriptográai protokollok szövegek rejtjelezésére szolgálnak, oly módon, hogy a jogosult fogadó képes legyen egyszeruen  és hatékonyan vissza fejteni a rejtett szöveget. Egy protokoll algoritmusként is felfogható, melyet több résztvevo hajt végre. A kriptoanalízis szintén több évezredes muvészet  és tudomány is, amely rejtjelezett  kriptorendszerek feltörésével foglalkoüzenetek (illetéktelen) visszafejtésével és a létezo zik. A kriptológia ezt a két területet öleli fel, a kriptográát és a kriptoanalízist. Ebben

96

3. Kriptográa

  a fejezetben foként olyan kriptograkus algoritmusokra koncentrálunk, amelyek lehetové teszik a biztonságos rejtjelezést. A kriptoanalízis algoritmusait – amelyekkel az ember próbálkozik, hogy kriptograkus protokollokat és rendszereket feltörjön –, megemlítjük, de nem vizsgáljuk teljes részletességgel.

3.1.1. Kriptográfia  alaphelyzete a 3.1. ábrán látható: Aliz és Bob olyan nem A kriptográa egyik jellemzo biztonságos csatornán kommunikálnak egymással, amelyet Erik lehallgat, és ezért az üzenetüket rejtjelezik egy kriptorendszer segítségével. 3.1. deníció (kriptorendszer). A kriptorendszer egy (P, C, K, E, D) ötös a következo  tulajdonságokkal: 1.

P, C és K

P a nyílt szöveg tér, C a rejtett szöveg tér és K a kulcstér. P C elemeit pedig rejtett szövegnek nevezzük. Egy üzenet a nyílt

véges halmazok,

elemeit nyílt szövegnek

szöveg szimbólumaiból álló szó. 2.

E = {Ek |

k

∈ K}

P → C függvényeknek a családja, amelyeket a D = {Dk | k ∈ K} azoknak a Dk : C → P függvényeknek a

azoknak az E k :

rejtjelezéshez használunk.

családja, amelyeket a visszafejtéshez használunk. 3.

Mindegyik e

∈K

kulcshoz van egy d

∈K

kulcs, melyekre minden p

∈ P nyílt szöveg

esetén Dd (E e ( p))

= p.

(3.1)

Egy kriptorendszerre azt mondjuk, hogy szimmetrikus (vagy titkos kulcsú), ha d vagy legalábbis d

=

e

könnyen” kiszámítható e-bol.  Egy kriptorendszerre azt mondjuk, hogy

” aszimmetrikus (vagy nyilvános kulcsú,

public-key”), ha d , e, és gyakorlatilag nem ” ” végezheto  el” az a feladat, hogy a d kulcsot e-bol  kiszámítjuk. Ekkor e-t nyilvános kulcsnak nevezzük, és d az e-hez tartozó titkos kulcs.  kulcstereket használnak a rejtjelezéshez és a visszafejtéshez, ami a Néha különbözo  módosítását vonja maga után. fenti deníció megfelelo A klasszikus kriptorendszerek bemutatására példaként legyen a

Σ = {A, B, . . . , Z} ábécé

a nyílt szöveg tér és ugyanakkor a rejtett szöveg tér is. Abból a célból, hogy a betukkel  úgy tudjunk számolni, mintha számok lennének, feleltessük meg

Σ-nak Z26 = {0, 1, . . . , 25}-öt.

A 0 szám tehát az A betunek  felel meg, az 1 a B betunek  stb. A nyílt szöveg szimbólumainak ez a természetes számokkal való kódolása természetesen nem tartozik hozzá a tényleges rejtjelezéshez, illetve visszafejtéshez. Az üzenetek

Σ∗

elemei, ahol

Σ∗

a

Σ fölötti szavak halmazát jelöli. Ha valamely m ∈ Σ∗

üzenet n hosszúságú blokkokra van felosztva, és blokkonként van rejtjelezve – ahogyan az sok kriptorendszerben szokásos –, akkor m egyes blokkjait 3.1. példa. Legyen

Zn26

elemeiként értelmezhetjük.

 Az elso  példa egy monoalfabetikus szimmetrikus kriptorendszer. Eltolásos rejtjelezo.

K = P = C = Z26 .

Az eltolásos rejtjel az a rejtett üzenet, amelyben a nyílt szöveg minden

jelének az ábécében a k számú betuvel  eltolt jel felel meg (modulo 26), ahol k rögzített szám. Az itt  k szereplo

∈ Z26

a kulcs. Ha a rejtett szöveg minden jelét ugyanennek a k kulcsnak a felhasználásával

  függvényt és a Dk visszafejto  visszatoljuk, akkor feltárul elottünk a nyílt szöveg. Az E k rejtjelezo

97

3.1. Alapok

m

B U D A P E S T

c

E X G D S H V W N H O H W S D U L C V D

K E L E T

P Á R I Z S A

  sifrírozásra. 3.2. ábra. Példa a Caesar-rejtjelezovel történo

függvényt mindegyik k

∈ Z26

kulcs esetén az alábbi módon deniáljuk: E k (m)

=

(m

Dk (c)

=

(c

+ k) mod 26

− k) mod 26,

ahol a k-val való összeadást és kivonást jelenként, modulo 26 kell elvégezni.  rejtjelezése k A 3.2. ábrán látható egy magyar m üzenetnek a c kóddal történo Az eltolással való rejtjelezés ezzel a speciális k

=

=

3 esetén.

1

3 kulccsal Caesar-rejtjelezo  néven is ismeretes,

 mert feltehetoen a római császár ezt használta háborúiban a katonai üzenetek titkosítására.

2

Ez egy

 amelyikben a nyílt szöveg minden betujét nagyon egyszeru  helyettesítéses rejtjelezo,  a rejtjel ábécé egy meghatározott betujével  helyettesítenek.

Mivel a kulcstér nagyon kicsi, az eltolásos rejtjelet igen könnyu  feltörni. Ez a rejtjel már arra a támadásra is érzékeny, amelynek során a támadó csupán a rejtett szöveget ismeri (rejtett szövegu  támadás,

ciphertext-only attacks”). Ha egyszeruen  a ” 26 lehetséges kulcs mindegyikét végigpróbáljuk, kiderül, hogy melyik kulcs esetén adódik  rejtjelezés értelmes nyílt szöveg, ha pedig a rejtett szöveg elég hosszú, csak egy megfelelo adódik.  monoalfabetikus kriptorendszer, mert a nyílt szöveg minden betuA Caesar-rejtjelezo  jének a rejtett szövegben mindig ugyanaz a betu  felel meg. Ezzel szemben egy polialfabetikus kriptorendszerben lehetséges, hogy ugyanannak a nyílt szövegbeli szimbólumnak kü rejtett szövegbeli szimbólumok felelnek meg, attól függoen,  lönbözo hogy a szöveg melyik helyén állnak. Egy ilyen polialfabetikus kriptorendszert, amelyik az eltolásos rejtjelezésre épül, de jóval nehezebb feltörni, Blaise de Vigenère (1523–1596) francia diplomata javasolt. Rendszere Leon Battista Alberti (szül. 1404) itáliai matematikus, Johannes Trithemius  (szül. 1492) német apát és Giovanni Porta (szül. 1535) itáliai természettudós elomunkáira  úgy muködik,  azzal a különbséggel, hogy épül. Ez a rejtjelezo  mint az eltolásos rejtjelezo, a betuk,  amelyekkel a nyílt szöveg egy szimbóluma sifrírozva van, most még a szövegbeli  helyüknek megfeleloen is változnak. 3.2. példa.

Vigenère-rejtjelezo.  Ez a szimmetrikus polialfabetikus kriptorendszer egy úgynevezett

Vigenère-négyzetet használ (lásd a 3.3. ábrát). Ez egy 26 sorból és 26 oszlopból álló mátrix. Mindegyik sorban az ábécé 26 betuje  szerepel, sorról sorra mindig egy pozícióval balra tolva. Ez azt jelenti,  hogy az egyes sorok felfoghatók egy-egy eltolásos rejtjelezoként, ahol a kulcsok sorban 0, 1, . . . , 25.  függ az, hogy a Vigenère-négyzet melyik sorát használja az ember A szimbólum szövegbeli helyétol egy nyílt szövegbeli szimbólum rejtésére. Az üzeneteket n állandó hosszúságú blokkra osztjuk és blokkonként rejtjelezzük, vagyis

P = C = Zn26 . Az

K =

n blokkhosszat a rendszer periódusának is nevezik. Egy w szóban az i-edik betut 

1

 ékezet nélkülieké. A fordító. Az ékezetes betuk  kódja ugyanaz, mint a megfelelo

2

Történelmi megjegyzés: Gaius Julius Caesar De Bello Gallico címu  muvében  tudósít arról, hogy a gall háborúban

(58–50 Kr.e.) hogyan küldött egy rejtjelezett üzenetet Q. Tullius Ciceronak (a híres szónok testvéröccsének), aki légiójával ostrom alatt volt. Az alkalmazott rendszer monoalfabetikus volt, és a latin betuket  göröggel helyettesí ol  volt-e szó. Ezt tette, Caesar írásaiból nem derül ki azonban az, hogy valóban a k = 3 kulcsú eltolásos rejtjelezor  az információt késobb Suetonius adta.

98

3. Kriptográa

0

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

1

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

2

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

3

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

4

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

5

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

6

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

7

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

V W X

8

I

J

K

L

M

N

O

P

Q

R

S

T

U

9

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

10

K

L

M

N

O

P

Q

R

S

T

U

V W X

11

L

M

N

O

P

Q

R

S

T

U

V W X

12

M

N

O

P

Q

R

S

T

U

V W X

13

N

O

P

Q

R

S

T

U

V W X

14

O

P

Q

R

S

T

U

V W X

15

P

Q

R

S

T

U

V W X

16

Q

R

S

T

U

V W X

17

R

S

T

U

V W X

V W X

18

S

T

U

19

T

U

V W X

20

U

V W X

V W X

Y

Z

Y

Z

A B

Y

Z

A

Y

Z

A

B

C

Y

Z

A

B

C

D E

Y

Z

A

B

C

D

Y

Z

A

B

C

D

E

F

Y

Z

A

B

C

D

E

F

G H

Y

Z

A

B

C

D

E

F

G

Y

Z

A

B

C

D

E

F

G

H

I

Y

Z

A

B

C

D

E

F

G

H

I

J K

Y

Z

A

B

C

D

E

F

G

H

I

J

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q R

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

21

V W X

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

22

W X

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V

23

X

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W

24

Y

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

25

Z

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V W X

3.3. ábra. Vigenère-négyzet: a

”

H” nyílt szöveget a

”

T” kulccsal rejtjelezve

”

Y

A”-t kapunk.

k

T O N Y T O N Y T

O N Y T O N Y T O N Y T

m

H U N G A R I A N

I

S

A L L

G R E E K

T O G E R M A N S

O N Y T O N Y

c

A I A E T F V Y G W F

Y E Z

T P X S X

R H U R P F O A Q

 használó sifrírozásra. 3.4. ábra. Példa a Vigenère-rejtjelezot

wi -vel jelöljük.  függvényt és a Dk visszafejto  függvényt, amelyek mindketten Az E k rejtjelezo képeznek, mindegyik k

∈ Z26 n

n  Z26 -be Zn26 -bol

 kulcs esetén a következoképpen deniáljuk: E k (b)

=

(b

+ k) mod 26

Dk (c)

=

(c

− k) mod 26,

ahol a k-val való összeadást és kivonást megint jelenként kell elvégezni modulo 26. Ez azt jelenti, hogy a megbeszélt k

∈ Zn26

 beture kulcsot betur  ol  a b

∈ Zn26

blokk szimbólumai fölé írjuk. Ha a

nyílt szöveg utolsó blokkjának kevesebb szimbóluma van, mint n, akkor a kulcsnak csak annyi jelét használjuk fel, amennyi szükséges. Amikor a nyílt szöveg i-edik bi szimbólumát rejtjelezzük, fölötte  a ki kulcsszimbólum áll, és a Vigenère-négyzet ki -edik sorát használjuk eltolásos rejtjelezoként. Válasszuk például az n

=

4 blokkhosszat, és a k

=

 TONY kulcsot. A 3.4. ábra egy angol nyelvu

m nyílt szöveg rejtjelezését mutatja, amelyik hét blokkból áll, és a c rejtett szövegben a Vigenère alkalmaztuk a k kulccsal. A nyílt szöveg elso  betujéhez, rejtjelezot  a

H”-hoz a T” kulcsszimbólu” ”  H”-oszlopának és a “ T”-sorának keresztezodésében A” ” ” ”  szimbóluma, amint azt a 3.3. ábrán láthatjuk. található, ez lesz a rejtett szöveg elso

mot rendeljük hozzá. A Vigenère-négyzet

Még számos további klasszikus kriptorendszer létezik, amelyeket azonban itt nem vizs Több lehetoség  gálunk meg közelebbrol. van arra is, hogy a kriptorendszereket jellegük

99

3.1. Alapok

és tulajdonságaik alapján osztályozzuk. A 3.1. deníció megvilágítja a szimmetrikus és az aszimmetrikus kriptorendszerek közötti különbséget. A két bemutatott szimmetrikus rend és a Vigenère-rejtjelezo)  rámutat a monoalfabetikus és a polialszer (az eltolásos rejtjelezo  helyettesítéses rejtjelezo. fabetikus rendszerek közötti eltérésekre. Mindketto  Ezek szembeállíthatók a permutációs rejtjelezokkel  (más néven transzpozíciós rejtjelezokkel),  amelyeknél a nyílt szöveg betuit  nem a rejtjelábécé bizonyos betui  helyettesítenek, hanem csupán a szövegbeli helyük változik, egyébként azonban nem változnak meg. Ha blokkonként n periódussal rejtjelezünk és mazzuk kulcstérként, ahol

Σ

Σn összes permutációinak halmazát alkaln

 lehetoségünk  m betus  ábécé, akkor m ! különbözo van arra,

hogy egy kulcsot kiválasszunk. Továbbá a blokkrejtjelezot  – amelyben, mint a Vigenèrerendszer esetén a nyílt szöveget blokkokra osztjuk, blokkonként rejtjelezzük –, egybevethetjük a folyamrejtjelekkel, amelyek egy folyamatos kulcsfolyamot hoznak létre. A blokkrejt különbözo  változatait vizsgálhatjuk. Egy fontos típust képviselnek az affin blokkjelezok  rejtjelezok.  Ezeket a következoképpen deniáljuk: az E D

(A−1 ,~ b)

 függvények visszafejto

n  Zm -be Znm -bol

(A,~ b)

 függvények, és a rejtjelezo

képeznek, és affin leképezések, ami azt je-

lenti, hogy az alábbi alakúak: E

(A,~ b)

D

(~ x)

(A−1 ,~ b)

Itt (A, ~ b) és (A elemekkel. A

−1

−1

, ~b)

(~ y)

= =

A~ x A

+ ~b mod m ,

−1

(3.2)

(~ y−~ b) mod m .

× n)-es mátrix Zm -beli Znm -beli vektorok, a muveleteket  pedig

a rejtjelezés illetve visszafejtés kulcsai; A (n

az A inverz mátrixa; ~ x, ~ y és ~ b mind

modulo m végezzük. Nézzünk néhány matematikai kiegészítést (lásd a 3.1.3. pontban a 3.2.

Zm gyur  u  fölötti – (n × n)-es A mátrixnak pontosan akkor van multip= 1. A inverz mátrixát A−1 = (det A)−1 Aadj segítségével i+ j deniáljuk, ahol det A az A determinánsa és Aadj = ((−1) det A j,i ) az A adjungált mátrixa. A det A determinánsát rekurzív módon deniáljuk: n = 1 és A = (a) esetén det A = a; Pn i+ j (−1) ai, j det Ai, j , ahol ai, j az n > 1 esetén minden i-re, ahol i ∈ {1, 2, . . . , n}, det A = j=1 A-nak az (i, j) indexu  eleme és az (n − 1) × (n − 1)-es Ai, j mátrixokat az A-ból úgy kapjuk, deníciót is): egy – a

likatív inverze, ha lnko(det A, m)

hogy az i-edik sort és a j-edik oszlopot törüljük. Egy mátrix determinánsát hatékonyan ki lehet számítani (lásd a 3-3. feladatot).  affin rejtjelezo,  amelynek kulcstere, Példaként megemlítjük, hogy a Vigenère-rejtjelezo

K = Znm

pontosan m elemu  (lásd a 3.2. példát). Ha (3.2)-ben a ~ b nullvektor, akkor lineáris n

blokkrejtjelezor  ol  van szó. Erre klasszikus példa a Hill-rejtjelezo,  amit 1929-ben Lester Hill

× n)-es Zm -beli elemeket tartal= 1. Emiatt a kulcsként megengedett mátrixok inver-

 talált ki. Ennél a rejtjelezonél a kulcstér az összes olyan (n mazó A mátrix, melyre lnko(det A, m) tálhatók, s az A

−1

inverz mátrixszal fejthetjük vissza az A mátrixszal rejtjelezett üzenetet.

 az E A (~ A Hill-rejtjelezot x)

=

 függvénnyel és a DA−1 (~ A~ x mod m rejtjelezo y)

= A~y mod m

 függvénnyel deniáljuk. Ez a legáltalánosabb lineáris rejtjelezo.  A permutációs visszafejto  szintén lineáris rejtjelezok,   speciális esetei. rejtjelezok és így a Hill-rejtjelezok

3.1.2. Kriptoanalízis  A kriptoanalízis feladata az, hogy adott kriptorendszereket feltörjön, elsosorban azért, hogy  a szükséges kulcsot a visszafejtéshez megállapítsa. Attól függoen, hogy milyen információk állnak a kriptoanalízis rendelkezésére, a támadások több típusát lehet megkülönböztetni, és

100

3. Kriptográa

ezzel a vizsgált kriptorendszer biztonságát, illetve sérülékenységét jellemezni. Az eltolásos  rejtjelezovel kapcsolatban már említettük a rejtett szövegu  támadást. Ez a leggyengébb formája a támadásnak, és az a kriptorendszer, amelyik ennek a támadásnak sem áll ellen, nem sokat ér.   érzékenyek az Az affin blokkrejtjelezok, mint például a Vigenère- és a Hill-rejtjelezok olyan támadásokra, amelyeknél a támadó egy elcsípett rejtjelezett szöveget és a hozzátar az alkalmazott kulcsra tozó nyílt szöveget is ismeri (ismert nyílt szövegu  támadás, és ebbol következtetni tud. Még inkább érzékenyek az olyan támadásokra, amelyeknél a támadó saját maga ki tud választani egy nyílt szöveget, és utána látja, hogy milyen rejtett szöveg tartozik hozzá (választott nyílt szövegu  támadás,

chosen-plaintext attacks).” A negye”  dik fajta támadás foként az aszimmetrikus kriptorendszerekre hatásos. Az ilyen (rejtjelezo  kulcs támadás,

encryption-key-attacks”) esetén a támadó csupán a nyilvánosságra hozott ”  az információból próbálja kulcsot ismeri, de nem ismer rejtett üzenetet, és egyedül ebbol meghatározni a titkos kulcsot. A különbség az, hogy a támadónak van ideje számításokat végezni, a többi támadás esetén azonban sietnie kell, mert az üzenetet már elküldték. Ezért kell aszimmetrikus kriptorendszerek esetén a kulcsteret nagynak választani, s ezzel szavatolni a rendszer biztonságát. Ennek következménye az, hogy a gyakorlatban sokszor kevéssé hatékonyak az aszimmetrikus rendszerek.  Az ilyen támadások gyakran a rejtjelezett szövegben eloforduló betuk  gyakoriságát vizsgálják. Emellett a nyílt szöveg számára alkalmazott természetes nyelv redundanciáját is kihasználják. Például sok természetes nyelvben az

E” betu  statisztikusan szignikáns ” tipikus” szövegek vizsgálata szerint az E” ” ” gyakorisága az angolban 12.31%, a franciában 15.87%, a németben pedig 18.46%. Más

 Hosszú módon a leggyakrabban fordul elo.

nyelvekben más betuk  léphetnek fel a legnagyobb gyakorisággal.

Tipikus” nn szövegek” A” a leggyakoribb betu.  ” A gyakoriságelemzés szemmel láthatóan hasznos a monoalfabetikus kriptorendszerek

ben például 12.06%-kal az

 elleni támadás során. Ha például egy eltolásos rejtjelezovel rejtett német szövegben az

Y” ” betu  lép fel leggyakrabban, ami a németben – akárcsak a legtöbb nyelvben – ritka, akkor

 arra következtethetünk, hogy ez az E” rejtett változata, az alkalmazott kulcs pedig az ebbol ” U” (k = 20) (lásd a 3.3. ábrát). Az egyes betuk  gyakorisága mellett vizsgálhatjuk a betupá ” rok (digrammok), a betuhármasok  (trigrammok) stb. A támadásnak ez a módja muködik  a polialfabetikus kriptorendszerek esetében is, feltéve, hogy a periódus (vagyis a blokkhossz) ismert. Az ismeretlen periódusú polialfabetikus kriptorendszerek ezzel szemben nagyobb biz például hosszú ideig ellenállt minden feltörési tonságot nyújtanak. A Vigenère-rejtjelezo kísérletnek. Csak 1863-ban, mintegy 300 évvel a feltalálása után, talált módszert Friedrich  feltörésére. Megmutatta, hoWilhelm Kasiski német kriproanalitikus a Vigenère-rejtjelezo   gyan lehet meghatározni az alkalmazott periódust a kulcsszöveg szavainak ismétlodéséb ol akkor is, ha a periódus kezdetben ismeretlen volt. Végül a gyakoriságelemzés segítségével a  Singh írja, hogy a rendkívül sokoldalú Charles Babbage, rejtjelezett szöveg visszafejtheto. akit sokan kora zsenijének tartanak, a Kasiski-féle módszert valószínuleg  korábban,1854ben felfedezte, bár nem hozta nyilvánosságra.  A kriptográa történetében mérföldkoként kell megemlítenünk Claude Shannonnak  munkáját. Shannon be(1916–2001). a modern kód- és információelmélet atyjának úttöro bizonyította, hogy vannak kriptorendszerek, amelyek egy bizonyos szigorú matematikai ér telemben tökéletes titkosságot tesznek lehetové. Pontosabban szólva egy kriptorendszer ak-

101

3.1. Alapok

|C| = |K|, a kulcsok K -ban egyenletes eloszlásúak, és minden ∈ C-re pontosan egy k ∈ K kulcs van, amelyre Ek ( p) = c. Ez azt

kor tökéletes titkosságú, ha p

∈ P-re

és minden c

jelenti, hogy egy ilyen kriptorendszer a legtöbb gyakorlati célra nem használható, mert ahhoz, hogy tökéletes titkosságot garantálhassunk, egyrészt minden kulcsnak legalább olyan  üzenet, másrészt egyszeri használat után minden hosszúnak kell lennie, mint a rejtjelezendo  kriptorendszereket késobb  kulcsot el kell dobni. Gyakorlati célra megfelelo fogunk ebben a fejezetben bemutatni.

3.1.3. Algebra, számelmélet és gráfelmélet   algoritmusok és problémák közül néhánynak a megértéséhez seA késobb sorra kerülo   néhány alapveto  gítségünkre lesz az algebra, és foként a csoport- és számelmélet körébol fogalom és tétel. Vonatkozik ez mind a 3. fejezetbeli kriptorendszerekre és zéró-ismeretu  protokollokra, mind pedig néhány, a 4. fejezetben vizsgált problémára. Az Olvasó megteheti, hogy ezt a fejezetet átugorja, és a szükséges fogalmaknak, eredményeknek csak akkor  néz utána, ha késobb felbukkannak. A bizonyításoktól ebben a fejezetben többnyire eltekintünk. 3.2. deníció (csoport, gyur  u,  test).



G=

(S , ◦) csoport, ha S nem üres halmaz,

◦ kétváltozós muvelet  S -en és teljesülnek a

következo  axiómák: –

zártság: (∀ x

–

asszociativitás: (∀ x

∈ S ) (∀y ∈ S ) [x ◦ y ∈ S ]; ∈ S ) (∀y ∈ S ) (∀z ∈ S ) [(x ◦ y) ◦ z = x ◦ (y ◦ z)]; semleges elem: (∃e ∈ S ) (∀ x ∈ S ) [e ◦ x = x ◦ e = x]; −1 inverz elem: (∀ x ∈ S ) (∃ x ∈ S ) [x ◦ x−1 = x−1 ◦ x = e].

– –

G csoport semleges elemének, az x−1 elemet x inverzének nevezzük. G félcsoport, ha G-ben az asszociativitás és a zártság teljesül a ◦ muveletre,  akkor is, ha G-nek nincs semleges eleme, vagy nem minden elemnek van inverze. Egy G = (S , ◦) félcsoport, vagy csoport kommutatív, ha x ◦ y = y ◦ x minden x, y ∈ S esetén teljesül. Egy G véges csoport elemeinek a száma a G rendje és ezt |G| jelöli. Az e elemet a



H = (T , ◦)-t a G = (S , ◦) csoport részcsoportjának nevezzük (H ≤ G jelöli), ha T ⊆ és H kielégíti a csoportaxiómákat.



Egy

S

R = (S , +, ·) hármas gyur  u,  ha (S , +) Abel-csoport, (S , ·) félcsoport és a disztribu-

tivitási szabály érvényben van: (∀ x

∈ S ) (∀y ∈ S ) (∀z ∈ S ) [(x · (y + z) = (x · y) + (x · z)) ∧ ((x + y) · z = (x · z) + (y · z))].

Egy

R=

(S , +, ·) gyur  u  kommutatív, ha az (S , ·) félcsoport kommutatív. Az (S , +) cso-

R gyur  u  nullelemének (röviden nullának), az (S , ·) R gyur  u  egységelemének (röviden egy) nevezzük.

port semleges elemét (ha létezik) az félcsoport semleges elemét az



Legyen

R =

(S , +, ·) egységelemes gyur  u. 

invertálhatónak (vagy

R valamely · y = y · x = 0.

ható. x

R

R

egy x elemét pontosan akkor nevezzük

egységének), ha ez az elem az (S , ·) félcsoportban invertál-

x eleme nullosztó, ha nem nulla, és egy

R-beli nem nulla y elemmel

102 •

3. Kriptográa

Test egy kommutatív, egységelemes gyur  u,  amelyben minden, a nullától különbözo  elem invertálható.

3.3. példa.

<

Csoport, gyur  u,  test. Legyen 1

k

∈ N.

A

Zk = {0, 1, . . . , k − 1}

halmaz az egész

számok modulo k tekintett összeadásával véges csoport, amiben semleges elem a 0.

Zk

a modulo k

vett összeadással és szorzással kommutatív egységelemes gyur  u  (lásd a 3. 3-1. feladatot). Abban az

Z p a modulo k tekintett összeadásra és szorzásra test. ∗ Legyen lnko(n, m) az n és m számok legnagyobb közös osztója. Legyen 1 < k ∈ N esetén Zk = ∗ 1 ≤ i ≤ k és lnko(i, k) = 1}. A számok modulo k vett szorzásával Zk véges csoport az 1 semleges

esetben, ha p prímszám, akkor

{i

elemmel.

 egyértelmuen Ha a szövegösszefüggésbol  kiderül, hogy valamely G a



= (S , ◦) csoportban Z∗k csoport

a muvelet,  akkor nem szükséges explicit módon megadni. A 3.3. példabeli

fontos szerepet játszik a 3.3. alfejezetben, ahol az RSA kriptorendszert mutatjuk be. Ennek a csoportnak a rendjét az Euler-féle

ϕ

függvény adja meg, vagyis

ϕ(k) = |Z∗k |. ϕ

alábbi

tulajdonságai a deníció következményei:

• •

ϕ(m · n) = ϕ(m) · ϕ(n) minden m, n ∈ N esetén, ha lnko(m, n) = 1 és ϕ( p) = p − 1 minden p prímszámra.

Ezeknek a tulajdonságoknak a bizonyítását az Olvasóra hagyjuk (lásd a 3.1-3. gyakorlatot).   a tulajdonságokból Foként a 3.3.1. pontban használjuk az alábbi állítást, amely ezekbol közvetlenül következik. 3.3. állítás. Ha n

=

p

· q, ahol

p és q különbözo  prímszámok, akkor

ϕ(n) = ( p − 1)(q − 1).

G csoport minden a elemére és az e = e összefüggés, ahol |G| a csoport rendjét jelöli. Az alábbi, ∗ úgynevezett Euler-tétel ennek speciális esete (a Zn csoportra). Az Euler-tétel speciális esete A Lagrange-tétel szerint egy véges, multiplikatív

|G|

semleges elemre fennáll az a

pedig, ha n prímszám, és a-nak nem osztója, 3.4. tétel (Euler). Minden a

∈ Z∗n

ϕ(n)

esetén a

kis Fermat-tételként” lett ismert. ”

≡ 1 mod n.

3.5. következmény (kis Fermat-tétel). Ha p prímszám és a

∈ Z∗p , akkor a p−1 ≡ 1 mod

p.

A 4.4. alfejezetben grázomorzmus problémára mutatunk algoritmusokat. Ez a probléma, amely a 3.5.2. pontban található zéró-ismeretu  protokollnál fontos szerepet játszik, bizonyos csoportelméleti problémák speciális eseteként is felfogható. Különösen fontosak itt a permutációcsoportok. 3.6. deníció (permutációcsoport).



≥ 1 természetes = {1, 2, . . . , n}. Az [n] összes permutációinak halmazát Sn jelöli. a π ∈ Sn permutációt n darab [n] × [n]-beli (i, π(i)) rendezett

Egy permutáció valamely halmaz bijektív leképezése önmagára. Egy n szám esetén legyen [n] Algoritmikus célokra

párból álló listával reprezentáljuk.



Sn -en permutációk kompozíciójaként deniálunk egy muveletet,  akkor Sn csoport π és τ Sn -beli permutációk, akkor πτ kompozíciójuk az az Sn -beli permutáció, amelyet úgy kapunk, hogy eloször  π-t, azután τ-t alkalmazzuk [n] elemeire, tehát Ha

lesz. Ha

103

3.1. Alapok

(πτ)(i)

= τ(π(i))



minden i

[n] esetén. Az

Sn

permutációcsoport semleges eleme az

= i minden i ∈ [n] Sn -nek azt a részcsoportját, amely csupán az id elemet tartalmazza, id jelöli.

identikus permutáció, amelyet a következoképpen  deniálunk: id(i) esetén.



Sn -nek valamely T részhalmaza esetén a T által generált hTi permutációcsoportot Sn legszukebb  olyan részcsoportjaként deniáljuk, amely T-t tartalmazza. Az Sn valamely G részcsoportját az ot  generáló halmazzal reprezentáljuk, amelyet G generátorrendszerének is nevezzük. G-ben valamely i ∈ [n] elem pályáját G(i) = {π(i) | π ∈ G} deniálja.



[n] valamely T részhalmaza esetén elemét önmagára képezi. Ha i



STn

n és

Sn -nek az a részcsoportja, amelyik T minden Sn részcsoportja G, akkor [i] G-beli (ponton-

az

kénti) stabilizátorát az alábbi módon deniáljuk:

G(i) = {π ∈ G | π( j) = A



∈ [i] esetén} .

G(n) = id és G(0) = G összefüggések fennállnak. G

Legyenek

H

j minden j

és

H

permutációcsoportok, és

jobb oldali mellékosztálya

vagy diszjunkt. Emiatt a

G

G-ben. H

H ≤ G. τ ∈ G

esetén

Hτ = {πτ | π ∈ H} G-ben azonos,

két jobb oldali mellékosztálya

permutációcsoportot

H G-beli

jobb oldali mellékosztályai

osztályozzák:

G = Hτ1 ∪ Hτ2 ∪ · · · ∪ Hτk .

(3.3)

H mindegyik G-beli jobb oldali mellékosztályának a számossága |H|. A {τ1 , τ2 , . . . , τk } (3.3) halmazt H G-beli jobb oldali reprezentánsrendszerének nevezzük. A pontonkénti stabilizátor fogalma különösen fontos olyan algoritmusok tervezésénél, amelyek permutációcsoportokkal dolgoznak. Az a lényeges struktúra, amelyet ilyenkor használunk azt úgy nevezzük, hogy id

G permutációcsoportbeli stabilizátor lánc:

= G(n) ≤ G(n−1) ≤ · · · ≤ G(1) ≤ G(0) = G .

G(i) -nek G(i−1) -ben teljes jobb oldali reprezenSn−1 tánsrendszere. Ekkor azt mondjuk, hogy T = Ti eros  generátora G-nek, és G = hTi. i= 1 Ekkor minden π ∈ G egyértelmuen  faktorizálható π = τ1 τ2 · · · τn alakban, ahol τi ∈ Ti . A Minden i-re 1



i



n esetén legyen

Ti

a

permutációcsoportokra vonatkozó alábbi algoritmuselméleti eredmények hasznosak lesz nek késobb, a 4.4. alfejezetben. 3.7. tétel. Ha a

G ≤ Sn

permutációcsoport a generátorrendszerével adott, akkor fennáll a

következo:  1.

Minden i

2.

Az id

∈ [n] esetén i G(i) pályája G-ben polinomiális ido alatt kiszámítható.

= G(n) ≤ G(n−1) ≤ · · · ≤ G(1) ≤ G(0) = G

stabilizátorlánc kiszámítható n-ben

polinomido  alatt, ami azt jelenti, hogy meghatározzuk minden i, 1 teljes jobb oldali reprezentánsrendszerét rendszerét.

Ti -t G

(i−1)

-ben és ezzel



i



n esetén

G(i)

G egy eros  generátor-

104

3. Kriptográa

Azokat a fogalmakat, amelyeket a 3.6. denícióban vezettünk be a permutációcsoporttal  vett konkrét példák alapján fogjuk megvilágítani. Elso kapcsolatban, most a gráfelméletbol sorban gráfok automorzmuscsoportját és izomorzmuscsoportját vizsgáljuk. Ehhez szükségünk lesz néhány gráfelméleti fogalomra. 3.8. deníció (gráfok izomorzmusa és automorzmusa).

Egy G gráf egy véges V (G)

csúcshalmazból, és egy véges E(G) élhalmazból áll, melyben lévo  élek bizonyos csúcsokat összekötnek egymással. Feltesszük, hogy nincsenek párhuzamos- és hurokélek. Ebben az alfejezetben kizárólag irányítatlan gráfokat vizsgálunk, ami azt jelenti, hogy az éleknek nincs irányításuk és rendezetlen csúcspárokként foghatjuk fel oket.  Két gráf, G és H, disz-

∪ H-t, amelyek V (G) és V (H) csúcshalmazai átnevezéssel diszjunkttá ∪ V (H) csúcshalmazzal és az E(G) ∪ E(H) élhalmazzal deniáljuk.

junkt egyesítését, G tehetok,  a V (G)

Legyen G és H két gráf ugyanannyi csúccsal. G és H közötti izomorzmus G csúcshalmazáról H csúcshalmazára képezo  éltartó bijekció. Állapodjunk meg abban, hogy V (G)

{1, 2, . . . , n} = V (H). Ekkor tehát G és H pontosan akkor izomorf (röviden G  olyan π ∈ Sn permutáció, hogy minden i, j ∈ V (G) csúcsra fennáll a következo:  { i, j} ∈

E(G)

⇐⇒ {π(i), π( j)} ∈

E(H)

=

H), ha van

.

(3.4)

G egy automorzmusa G csúcshalmazának önmagára való éltartó bijekciója. Minden gráf esetén fennáll az id triviális automorzmus. Jelöljük Iso(G , H)-val a G és H közötti összes izomorzmus halmazát, Aut(G)-vel pedig G összes automorzmusának halmazát. A gráfizomorzmus problémát (röviden

GI)

és a gráfautomorzmus problémát (röviden

GA)

a

következo  módon deniáljuk:

GI GA

= {(G, H) | G és H izomorf gráfok} ; = {G | G tartalmaz nem triviális automorzmust} .

Algoritmikus célokra a gráfokat vagy csúcs- és él-listájukkal, vagy csúcsmátrixukkal reprezentáljuk, amelyben az (i, j) helyen 1 áll, ha {i, j} egy él a gráfban, különben pedig 0. Valamely gráfnak ehhez az eloállításához  elegendo  a

Σ = {0, 1}

ábécével való kódolás. Ha

gráfpárokat kívánunk szemléltetni, akkor olyan bijektív párosítási (·, ·) függvényt alkalmazunk, amely

Σ∗ × Σ∗ -ról Σ∗ -ra képez, polinomiális idoben  kiszámítható, és van polinomiális

idoben  kiszámítható inverze.

3.4. példa. (Gráfok izomorzmusa és automorzmusa.) A 3.5. ábrán látható G és H gráfok izomorfak. Egy

π



: V (G)

 V (H) izomorzmus, amelynél (3.4)-nek megfeleloen adjuk meg a csúcsok

 módon: szomszédosságát, megadható például a következo

π=

π =

1 2 3 4 5

(3

4 1 5 2

), illetve ciklikus módon írva

(1 3)(2 4 5). G és H között van még három további izomorzmus, és így |Iso(G , H)|

=

4, (lásd a

3.1-4. gyakorlatot). G és H azonban nem izomorfak F-fel. Ez azonnal látható, ha a fokszámok soro élek számát). A G-hez, illetve H-hoz zatát nézzük (vagyis minden csúcs esetén a csúcsra illeszkedo tartozó sorozat különbözik az F-hez tartozótól: G és H esetén ez a sorozat (2, 3, 3, 4, 4), miközben F esetén (3, 3, 3, 3, 4). G egy nem triviális

ϕ

: V (G)



ϕ=( ), il) illetve τ = (1)(2)(3 4)(5) 1 2 3 4 5

V (G) automorzmusa például

2 1 4 3 5

ϕ = (1 2)(3 4)(5) segítségével adható meg, egy másik pedig τ = ( segítségével. G-nek van még két további automorzmusa és így |Aut(G)| = 4 (lásd a 3.1-4. gyakorla1 2 3 4 5

letve

1 2 4 3 5

tot). Az Iso(G , H), Aut(F), Aut(G) és Aut(H) permutációcsoportok (5)

Aut(G)



(4)

Aut(G)

≤ ··· ≤

(1)

Aut(G)



(0)

Aut(G)

S5

részcsoportjai. Aut(G)-ben az (5)

stabilizátorlánc az Aut(G)

=

(4)

Aut(G)

=

105

3.1. Alapok

F

1

2

3

5

4 G

H

5

3

2

1

4 3

1

2

5

4

3.5. ábra. A három gráf: G és H izomorfak, de F nem izomorf velük.

Aut(G)

(3)

=

(2)

id, Aut(G)

=

= h{id, τ}i

(1)

Aut(G)

és Aut(G)

(0)

=

Aut(G) részcsoportokból áll. G

automorzmuscsoportjában, Aut(G)-ben az 1 és 2 csúcsok pályája

{1, 2},

a 3 és 4 csúcsok pályája

{3, 4}, és az 5 pályája {5}. Az Iso(G , H) és Aut(G) permutációcsoportok rendje pontosan akkor azonos, ha G és H izomorfak. Ha ugyanis G és H izomorfak, akkor |Iso(G , H)| hogy Aut(G)

=

Iso(G , G). Másrészt ha G



= |Aut(G)|

következik abból,

H, akkor Iso(G , H) üres, ugyanakkor Aut(G)-

 következik a 3.9. lemma (3.5) ben mindig benne van az id triviális automorzmus. Ebbol  állítása, amire késobb a 4.4. alfejezetben szükségünk lesz. A (3.6) igazolására tegyük fel,   esetben G illetve H helyett a G illetve H komplemenhogy G és H összefüggoek; ellenkezo ter gráfokat tekintjük, (lásd a 3.1-5. gyakorlatban). G



H egy automorzmusa, amely G

 és H csúcsait felcseréli, egy Iso(G , H)-beli és egy Iso(H, G)-beli izomorzmusból tevodik össze. Így |Aut(G

 (3.5) felhasználásával ∪ H)| = |Aut(G)| · |Aut(H)| + |Iso(G, H)|2 , amibol

következik (3.6). 3.9. lemma. Bármely két G és H gráf esetén fennállnak a következok: 

( |Iso(G, H)| = ( |Aut(G ∪ H)| = Ha G és H izomorf gráfok, és

|Aut(G)| = |Aut(H)|, 0, · |Aut(G)| · |Aut(H)|, |Aut(G)| · |Aut(H)|, 2

τ ∈

ha G

 

ha G ha G

H

(3.5)

H ;

 

H H

.

(3.6)

Iso(G , H), akkor Iso(G , H)

lenti, hogy Iso(G , H) Aut(G)-nek jobb oldali mellékosztálya mellékosztály azonos, vagy diszjunkt,

ha G

= Aut(G)τ. Ez azt jeSn -ben. Mivel két jobb oldali

Sn (3.3) szerint Aut(G) jobb oldali mellékosztályaira

bomlik:

Sn = Aut(G)τ1 ∪ Aut(G)τ2 ∪ · · · ∪ Aut(G)τk ,

(3.7)

106

3. Kriptográa

ahol |Aut(G)τi |

= |Aut(G)| minden i, 1 ≤ i ≤ k esetén. Ezek szerint az Sn permutációiból {τ1 , τ2 , . . . , τk } halmaz Aut(G)-nek Sn -beli jobb oldali reprezentánsrendszerét alkotja. Ha π(G) azt a H  G gráfot jelöli, amelyet akkor kapunk, ha a π ∈ Sn permutációt G csúcsaira alkalmazzuk, akkor {τi (G) | 1 ≤ i ≤ k} = { H | H  G }. Mivel Sn -ben pontosan  következik: n! = n(n − 1) · · · 2 · 1 permutáció van, (3.7)-bol álló

|{H | H  G}| = k =

|Sn | n! = . |Aut(G)| |Aut(G)|

Ezzel beláttuk az alábbi következményt. 3.10. következmény. Ha a G gráfnak n csúcsa van, akkor pontosan n!/|Aut(G)| vele izomorf gráf van.  G gráffal így pontosan 5!/4 A 3.4. példa 3.5. ábráján lévo

=

 30 gráf izomorf. A következo

 lemmára késobb, a 4.4. alfejezetben lesz szükségünk. 3.11. lemma. Legyenek G és H n csúcsú gráfok. Deniáljuk az alábbi halmazt: A(G , H)

=

{(F, ϕ) | F  G és ϕ ∈ Aut(F)} ∪ {(F, ϕ) | F 

H és

ϕ ∈ Aut(F)}.

Ekkor fennáll a következo: 

( |A(G, H)| =

n!,

ha G

2n!,

ha G

Bizonyítás. Ha F és G izomorfak, akkor |Aut(F)|

 

H H.

= |Aut(G)|.

 A 3.10. következménybol

adódik, hogy

|{(F, ϕ) | F  G és ϕ ∈ Aut(F)}| = és hasonlóan megmutatható az is, hogy

|{(F, ϕ) |

n!

|Aut(F)| F



H és

· |Aut(F)| = n!, ϕ ∈ Aut(F)}| =

n!. Ha G és H

izomorfak, akkor

{(F, ϕ) | F  G és ϕ ∈ Aut(F)}

= {(F, ϕ) | F 

H és

ϕ ∈ Aut(F)} .

 következik, hogy | A(G , H)| = n!. Ha pedig G és H nem izomorfak, akkor Ebbol {(F, ϕ) | F  G és ϕ ∈ Aut(F)} és {(F, ϕ) | F  H és ϕ ∈ Aut(F)} diszjunkt halmazok. Eszerint | A(G , H)| = 2n!.

Gyakorlatok 3.1-1. A 3.6. ábrán láthatunk két elfogott rejtjelezett szöveget, c1 -et és c2 -t. Tudjuk, hogy  ugyanannak az m nyílt szövegnek a rejtett változata, és az egyik eltolásos rejtjelemindketto   zovel, a másik pedig Vigenère-rejtjelezovel lett sifrírozva. Mindkét szöveget fejtsük vissza.  módszernél egy Útmutatás. A visszafejtés után megállapítható, hogy az egyik rejtjelezo igaz, a másiknál egy hamis állítás adódik. Van esetleg értelme gyakorisági elemzést alkalmazni?

107

3.2. Kulcscsere Diffie és Hellman szerint

c1

W K L V V H Q W H Q F H L V H Q F U B S W H G E B F D H V D U V N H B

c2

N U O S J Y A Z E E W R O S V H P X Y G N R J B P W N K S R L F Q E P 3.6. ábra. Ugyanannak a nyílt szövegnek két rejtett változata a 3.1-1. gyakorlatban.

Z a szokásos összeadással és szorzással nullosztómentes gyur  u.  Z test? Mit mondhatunk az (N, +), (N, ·) és (N, +, ·) algebrai struktúrák tulajdonsága-

3.1-2. Mutassuk meg, hogy Vajon iról?

ϕ-függvény alábbi tulajdonságait: ϕ(m · n) = ϕ(m) · ϕ(n) minden m, n ∈ N esetén, ha lnko(m, n) = 1. b. ϕ( p) = p − 1 minden p prímszám esetén.

3.1-3. Bizonyítsuk be az Euler-féle a.

Ezeknek a tulajdonságoknak a segítségével bizonyítsuk be a 3.3 állítást. 3.1-4. Adottak az F, G és H gráfok a 3.5. ábrán. a. Határozzuk meg a G és H közötti összes izomorzmust. b. Határozzuk meg F, G és H összes automorzmusát. c. A G és H közötti melyik izomorzmus esetén lesz Iso(G , H) Aut(G)-nak jobb oldali mellékosztálya

S5 -ben,

vagyis melyik

τ ∈

Iso(G , H) esetén lesz Iso(G , H)

Határozzuk meg Aut(F), Aut(G) és Aut(H) jobb oldali reprezentánsrendszerét

= Aut(G)τ? S5 -ben.

d. Határozzuk meg F minden csúcsának pályáját Aut(F)-ben és H minden csúcsának pályáját Aut(H)-ban. e. Határozzuk meg az Aut(F)

≤ S5 és Aut(H) ≤ S5 részcsoportok stabilizátorláncát.

f. Hány 5 csúcsú gráf izomorf F-fel?  3.1-5. Valamely G gráf komplementer gráfját a következoképpen deniáljuk: a csúcshalmaza V (G)

= V (G), az élhalmaza pedig E(G) = {{i, j} | i, j ∈ V (G) és {i, j} <

E(G)}. Mutas-

suk meg, hogy: a. Aut(G)

= Aut(G). = Iso(G, H).

b. Iso(G , H)

 ha G nem összefüggo.  c. G összefüggo,

3.2. Kulcscsere Diffie és Hellman szerint  Ebben az alfejezetben, valamint a következokben is szükségünk lesz a 3.1.3. pontban látott  számelméleti alapfogalmakra. Elsosorban a 3.3. példabeli Euler-féle

Z∗k

multiplikatív csoportra és az

ϕ függvényre gondolunk; a maradékosztálygyur  uk  aritmetikáját a fejezet végén

fogjuk megvilágítani a 3-1. feladatban. A 3.7. ábra a kulcscserére vonatkozó Diffie–Hellman-protokollt mutatja. Ez a protokoll az r alapú, p modulusú moduláris exponenciális függvényen alapszik, ahol p prímszám és r primitív gyök modulo p. r 1



d

<

∈ Z∗n

primitív gyök modulo n, ha r

d

.

1 mod n minden d,

 ϕ(n) esetén. Egy r modulo n primitív gyök eloállítja az egész



Z∗n

csoportot, ami

Zn = {r | 0 ≤ i < ϕ(n)}. Emlékeztetünk arra, hogy ha p prímszám, akkor a Z∗p multiplikatív csoport rendje ϕ( p) = p − 1. Z∗p -nak pontosan ϕ( p − 1) primitív gyöke van

azt jelenti, hogy

i

(lásd a 3.2-1. gyakorlatot is). 3.5. példa. Nézzük

Z∗5 = {1, 2, 3, 4}-et.

Mivel

Z∗4 = {1, 3},

így

ϕ(4) =

2, tehát a modulo 5 primitív Z∗5 -ot,

 gyökök száma 2, modulo 5 primitív gyökök a 2 és a 3, így mind 2 mind 3 eloállítja az egész

108

3. Kriptográa

Lépés

Aliz

Erik

Bob

1

Aliz és Bob megállapodnak egy nagy p prímszámban, és egy r modulo p primitív gyökben; p és r nyilvánosak

2

véletlenszeruen  választ egy nagy, tit-

véletlenszeruen  választ egy nagy, tit-

kos a számot, és kiszámítja a követkea  α = r mod p zot:

kos b számot, és kiszámítja a követke zot:

α⇒ ⇐β

3 4

kiszámítja kA

= βa

mod p értékét

β = rb

mod p

kiszámítja k B

= αb

mod p értékét

3.7. ábra. Diffie és Hellman szerinti kulcscserére vonatkozó protokoll.

mivel 2

0

3

0

= 1; = 1;

2

1

3

1

= 2; = 3;

2

2

3

2

= 4; ≡ 4 mod 5;

2

3

3

3

≡ 3 mod 5 ; ≡ 2 mod 5 .

Nem minden n számnak van modulo n primitív gyöke; a 8 a legkisebb ilyen példa.  tudjuk, hogy valamely n számra pontosan akkor van modulo n Az elemi számelméletbol primitív gyök, ha n vagy {1, 2, 4}-nek eleme, vagy pedig n

=

=

k

q , illetve n

k

2q alakú, ahol

q páratlan prímszám. 3.12. deníció (diszkrét logaritmus). Legyen p prímszám és r egy modulo p primitív gyök. Az r alapú, p modulusú képez,

expr, p (a) =

r

a

expr, p

moduláris exponenciális függvényt, amely

mod p-vel deniáljuk. Az inverz függvényét diszkrét logaritmusnak

nevezzük, ez rögzített p és r esetén az logr

expr, p (a) mod

∗ Z p−1 -rol  Z p -re

expr, p (a)

=

értéket a-ra képezi. Fennáll, hogy a

p.

A 3.7. ábra protokollja muködik,  mert kA

= βa =

r

ba

=

r

ab

= αb =

k B miatt (modulo

p aritmetikával) Aliz valójában ugyanazt a kulcsot számolja ki, mint Bob. Ezt a kulcsot könnyen kiszámíthatják, mivel az

 ´ ´

expr, p

moduláris exponenciális függvény a M ´

algoritmussal hatékonyan meghatározható. Ezzel szemben Erik arra irányuló

törekvése, hogy a kulcsukat meghatározza, nehézségekbe ütközik, mert a diszkrét logaritmus igen nehéz problémának számít. Az

expr, p

moduláris exponenciális függvény így egy

lehetséges egyirányú függvény, olyan függvény, amelyik bár könnyen kiszámítható, de csak nehezen invertálható. Sajnos máig nem tudjuk, hogy van-e egyáltalán egyirányú függvény. S ami még inkább kár: jóllehet nem tudjuk, hogy van-e ilyen, a kriptográában az egyirányú függvények kulcsszerepet játszanak, mert sok kriptorendszer biztonsága azon a feltevésen alapszik, hogy egyirányú függvények valóban vannak. M - ´ (a, b, m) ´ ´ 1

B m a modulus, b < m az alap és a a kitevo

2

 a kitevot  kettes számrendszerben: a állítsuk elo 2

i

3

számoljuk ki egymás után a b

4

számoljuk ki modulo m aritmetikával b

=

értékeket, ahol 0 a

i

=

Qk

Pk

i= 0

i+1

i = 0 ai =1

b

2

i

6

return b

=

=



2

b

i

2

értékét.

B ha beleszámoltuk a szorzatba b2 -t, és kiszámítottuk b2

a

∈ {0, 1}.

≤ i ≤ k, felhasználva, hogy b2

5

A b

i

ai 2 , ahol ai

i+1

i

2

-t, akkor b -t kitörölhetjük

a

Qk i = 0 ai =1

2

b

i

kiszámítása helyes, mert a modulo m aritmetikában fennáll a követ-

.

109

3.2. Kulcscsere Diffie és Hellman szerint

 kezo: a

b

Pk

=b

i=0

i

ai 2

=

k Y 

2

b

i

a

i

=

i=0

Miért lehet hatékonyan kiszámítani az

k Y

2

b

i

.

i = 0 ai =1

expr, p (a) =

r

a

mod p hatványfüggvényt? Ha

 mindegyik ezt a számítást naivan hajtjuk végre, sok szorzásra lehet szükségünk az a kitevo értékére. A M - ´ algoritmussal azonban Aliznak nem a ´ ´

− 1 szorzást kell

végeznie, mint a naiv módszernél, hanem csupán legfeljebb 2 log a szorzásra van szüksége.  A M - ´ algoritmus egy exponenciális tényezovel gyorsítja a moduláris ´ ´ hatványozást. 3.6. példa. (M - ´ a Diffie–Hellman-protokollban.) Aliz és Bob a p ´ ´

= 5 prímszámot = 3-at, mint modulo 5 primitív gyököt választja. Aliz az a = 17 titkos számot választja. Mivel 17 Aliz Bobnak az α számot akarja küldeni, ki szeretné számítani az α = 3 = 129140163 ≡ 3 mod 5 0 4  bináris alakban felírva 17 = 1 + 16 = 2 + 2 . Aliz lépésenként számítja ki az értéket: számot. A kitevo és az r

0

2

3

= 3;

3

1

2

= 32 ≡ 4 mod 5; 17

 kiszámítja a 3 Ebbol



2

3

0

3

2

2

≡ 42 ≡ 1 mod 5; 4

· 32 ≡

3

·1 ≡

3

3

2

≡ 12 ≡ 1 mod 5;

3

2

4

≡ 12 ≡ 1 mod 5.

3 mod 5 értéket. Figyeljük meg, hogy Aliz ahelyett,

hogy 16-szor szorzott volna, csupán négyszer emelt négyzetre és egyszer szorzott határozása érdekében. Ha Bob saját magának a b

=

α=

3 mod 5 meg-

 választja, akkor ugyanezzel az 23 titkos kitevot

β = 323 = 94143178827 ≡ 2 mod 5, végül 3.7. ábrán látható Diffie–Hellman-protokollal meghatározzák

  részét, tehát eljárással ki tudja számítani a kulcs orá eso Aliz és Bob a közös titkos kulcsukat a

(lásd a 3.2-2. gyakorlatot). A protokoll biztonsága ebben az esetben természetesen nincs garantálva, hiszen p

=

5-tel nagyon kicsi prímszámot választottak; ez a játékpélda csak a könnyebb megértést

szolgálja.

Ha Erik gyelmesen lehallgatja Aliz és Bob társalgását, amely a 3.7. ábra szerinti Diffie–Hellman-protokoll szerint zajlik, akkor ismeri a p, r,  szeretné meghatározni a kA bol

=

α

és

β

értékeket, amelyek-

k B titkos kulcsukat. Eriknek ezt a problémáját Diffie–

= logr α mod p és = logr β mod p titkos számokat, akkor, akárcsak Aliz és Bob, ki tudná számolni a = βa mod p = αb mod p = kB kulcsot, és megoldaná a Diffie–Hellman-problémát. Ez

Hellman-problémának nevezik. Ha Erik meg tudná határozni az a a b kA

a probléma tehát nem nehezebb, mint a diszkrét logaritmus problémája. A fordított kérdés, hogy vajon a Diffie–Hellman-probléma legalább olyan nehéz-e, mint a diszkrét logaritmusé, tehát hogy ugyanolyan nehezek-e, ez máig csupán nem bizonyított sejtés. Mint sok más protokoll, a Diffie–Hellman-protokoll biztonságossága mindezidáig nem bizonyított. Mivel szerencsére eddig sem a diszkrét logaritmus, sem a Diffie–Hellman-probléma hatékonyan nem oldható meg, ez a közvetlen támadás nem jelent valóságos veszélyt. Másrészt azonban vannak más, nem közvetlen támadások, amelyeknél a kulcsot nem közvetlenül a Diffie–Hellman-protokollban átadott

α,

illetve

β

 határozzák meg. Így értékekbol

például a Diffie–Hellman nem biztonságos a

középen állás támadással” szemben. A fent ” leírt támadás passzív, ez pedig aktív abban az értelemben, hogy a támadó Erik nem elégszik meg a passzív hallgatózással, hanem megpróbálja a protokollt aktívan a saját ízlésé nek megfeleloen megváltoztatni. Úgyszólván beáll

α = ra mod p, és αE = rc mod p értékét

Aliz Bobnak küldött

középre”, Aliz és Bob közé és elfogja ” b Bob Aliznak küldött β = r mod p üzenetét. α

β helyett saját továbbítja Bobnak, Aliznak pedig a szintén saját βE = rd mod p értéket, miközben Erik a titkos c és d értékeket maga választotta. Ha most és

110

3. Kriptográa

Lépés

Aliz

Erik

Bob

1

Véletlenszeruen  választ két nagy prímszámot, p-t és q-t és kiszámítja az n = pq és ϕ(n) = ( p − 1)(q − 1)

értékeket, nyilvános (n, e) kulcsát, és d titkos kulcsát, 2 3

c

=

e

m

⇐ (n, e)

amelyek megfelelnek (3.8) és (3.9)-nek

mod n szerint

rejtjelezi m-et 4

c



5

visszafejti c-t m

= cd

mod n szerint

3.8. ábra. Az RSA-protokoll.

Aliz a kA

= (β E )a

mod p értéket kiszámítja, kA valójában ezentúl nem a Bobbal – mint

ahogy azt Aliz hiszi –, hanem az Erikkel való kommunikáció kulcsa, mert Erik ezt a kulcsot  (modulo p aritmetikával): kE ugyanúgy értékeli ki, mint ok

= αd =

r

ad

=

r

da

= (βE )a =

kA

segítségével. Ugyanígy lefolytathat Erik egy észrevehetetlen kulcscserét Bobbal, és a jö voben vele kommunikálhat anélkül, hogy ezt Bob sejtené. A hitelességnek ezzel a problé májával késobb fogunk alaposabban foglalkozni a zéró-ismeretu  protokollokról szóló 3.5. alfejezetben.

Gyakorlatok

Z∗13 -ban, illetve Z∗14 -ban? ∗ valamint Z14 összes primitív gyökét,

3.2-1. a. Hány primitív gyök van b. Határozzuk meg



Z13

és bizonyítsuk be, hogy

ezek valóban primitív gyökök.  hogy a teljes c. Mutassuk meg az összes modulo 13, illetve modulo 14 primitív gyökrol,  Z∗13 -ot, illetve a teljes Z∗14 -ot eloállítják. 23 3.2-2. a. Határozzuk meg a β = 3 = 94143178827 ≡ 2 mod 5 értéket (Bob 3.6. példabeli értékét) a M - ´ algoritmussal. ´ ´ b. Határozzuk meg a 3.6. példában az α és β számokhoz Aliz és Bob közös titkos kulcsát  Diffie–Hellman-protokoll szerint. a 3.7. ábrán lévo

3.3. RSA és faktorizálás 3.3.1. RSA Az RSA-kriptorendszer, amelyet három feltalálójáról, Ron Rivest, Adi Shamir és Leonard  ismert nyilvános kulcsú kriptorendszer. Manapság is igen Adleman-ról neveztek el, az elso népszeru,  és sok kriptográai alkalmazásba beillesztik. A 3.8. ábrán összefoglaltuk az RSA protokoll egyes lépéseit, amelyeket végül részletesen is leírunk, valamint lásd a 3.7. példát. Kulcsgenerálás. Bob választ véletlenszeruen  két nagy prímszámot, p-t és q-t úgy, hogy p

,

q, és kiszámítja n

=

pq szorzatukat. Azután választ egy e

∈ N

 az alábbiak kitevot

szerint 1

< e < ϕ(n) = ( p − 1)(q − 1)

majd meghatározza e mod 1

és

lnko(e, ϕ(n))

=1,

(3.8)

ϕ(n) inverzét, vagyis azt az egyértelmu d számot, amelyre: < d < ϕ(n)

és

e

· d ≡ 1 mod ϕ(n).

(3.9)

111

3.3. RSA és faktorizálás

Az (n, e) pár Bob nyilvános kulcsa, d pedig Bob titkos kulcsa. Rejtjelezés. Mint már a 3.1. alfejezetben is, az üzenetek egy blokkonként, állandó hosszúságú blokkhosszal

|Σ|-adikus

Σ

ábécé feletti szavak és

természetes számokként kódol-

 juk oket. Ezeket a számokat azután rejtjelezzük. Legyen m

<

n az üzenet egyik rejtjelezett

 szám, amelyet Aliz szeretne Bobnak küldeni. Aliz ismeri Bob nyilblokkjának megfelelo vános (n, e) kulcsát, és m-et rejtjelezi c

=

 függvény E (n,e) (m) számként, ahol a rejtjelezo

deníciója az alábbi: E (n,e) (m) Visszafejtés. Legyen c, 0



c

<

= me

mod n

.

n az a szám, amely a rejtjelezett szöveg egyik blokk-

jának kódja, amelyet Bob megkap, Erik pedig lehallgatja. Bob desifrírozza c-t a d titkos  függvény segítségével: kulcsa és az alábbi visszafejto Dd (c)

= cd

mod n

.

Azt, hogy az RSA-módszer valóban kriptorendszer a 3.1. deníció értelmében, a 3.13. tétel állítja. Ennek a tételnek a bizonyítását az Olvasóra hagyjuk (lásd a 3.3-1. gyakorlatot). 3.13. tétel. Legyenek (n, e) a nyilvános, d a titkos kulcsok az RSA-protokollban. Ekkor minden m, 0



m

<

n üzenet esetén m

=

e d

(m )

mod n. Így az RSA (nyilvános kulcsú) kripto-

rendszer. Az RSA-eljárás hatékonysága érdekében megint a M - ´ algoritmust ´ ´ használjuk a gyors-hatványozásra. Hogyan válasszuk meg a 3.8. ábrán bemutatott RSA pro tokollban a p és q prímszámokat? Eloször is elég nagyoknak kell lenniük, egyébként Erik az n számot Bob nyilvános (n, e) kulcsában faktorizálná, és n p és q prímfaktorait meghatározná, így a kiterjesztett euklideszi algoritmussal könnyen meghatározhatná Bob d titkos kulcsát, amely e mod

ϕ(n) egyértelmu inverze, ahol ϕ(n) =

(p

− 1)(q − 1). A

p és q prím-

 számoknak titkosaknak kell maradniuk, s ezért elegendoen nagyoknak kell lenniük. A gya kell tehát korlatban p-t és q-t mindig legalább 80 decimális jegyunek  kell választani. Elo állítani ilyen nagyságú véletlen számokat, és tesztelni kell egy ismert véletlen prímteszttel, hogy vajon valóban prímek-e. Mivel a prímszámok elmélete szerint körülbelül N / ln N Nnél kisebb prímszám van, nagy a valószínusége  annak, hogy nem túl sok próbálkozás után prímszámra akadjunk.   hogy p és q prímek-e. Elméletileg determinisztikusan polinomiális idoben eldöntheto,  eredményt publikálták, hogy a Agrawal, Kayal és Saxena a közelmúltban azt a meglepo

PRIMES = {bin(n) | n prím} prímszámprobléma a P bonyolultsági osztályba tartozik. Ez az áttörés megoldotta a bonyolultságelmélet régóta nyitott problémáját, mert a grázomorzmus probléma mellett a prímszámprobléma tunt  olyannak, amely se nem P-beli, se nem 3

NP-teljes.

12

Bár az algoritmus futási idejének eredeti – O(n

6

) – korlátját azóta O(n )-ra

javították, az algoritmus a gyakorlati alkalmazások számára nem elég gyors.  algoritmusa, amely Miller deterA legkedveltebb véletlen prímteszt Rabin következo minisztikus algoritmusának elvére épül.

3

A P és NP bonyolultsági osztályokat a 4.1. alfejezetben deniáljuk, az NP-teljességet pedig a 4.2. alfejezetben.

112

3. Kriptográa

M–R(n) 1 2 3 4

− 1 = 2k m átalakítást, ahol m és n páratlanok válasszunk véletlenszeruen  egy z ∈ {1, 2, . . . , n − 1} számot egyenletes eloszlással m számítsuk ki az x = z mod n értéket if x ≡ 1 mod n

végezzük el az n

5

then return

6

else for j

”

n prímszám” és álljunk meg

7

← 0 to k − 1 if x ≡ −1 mod n

8

then return

9

else x

10



x

n prímszám”



mod n;

return

n nem prímszám” ”

A M–R teszt úgynevezett Monte-Carlo-algoritmus,

nem” válasza megbíz”  A Miller–Rabinigen” válasza azonban egy bizonyos hibavalószínuséggel  értendo. ” 3  O(n ) idoben  teszthez hasonló Solovay és Strassen prímtesztje. Mindketto dolgozik. A

ható,

Solovay–Strassen-teszt azonban kevésbé népszeru,  mert a gyakorlatban nem olyan hatékony, mint a Miller–Rabin-teszt és kevésbé pontos. Azon problémák osztályának, amelyek a Monte-Carlo-algoritmussal mindig megbízható

igen” válasszal oldódnak meg, külön nevük van: RP, a Randomized Polynomial Time ”  származó betuszó. kifejezésbol  A komplementer osztály, coRP = { L | L ∈ RP}, mindazokat a

problémákat tartalmazza, amelyekre a Monte-Carlo-algoritmus mindig megbízható nem” ” választ ad. RP-t formálisan a nemdeterminisztikus polinomiális ideju  Turing-gépekkel de niáljuk (röviden NPTM; lásd a 4.1. alfejezetet és foként a 4.1., 4.2. és 4.3. deníciókat), amelyeknek a muködése  véletlen folyamatként fogható fel: minden nemdeterminisztikus  két elágazás mindeelágazásnál a gép úgymond pénzfeldobással muködik,  és a következo gyike 1/2 valószínuséggel  következik be. Az NPTM-ben megvalósuló utak száma szerint minden bemeneti adathoz tartozik egy bizonyos megvalósulási valószínuség,  ahol hibák is felléphetnek. RP deníciója megkívánja, hogy az elfogadott bemeneti értékek esetén a hibavalószínuség  soha nem lehet nagyobb 1/2-nél, miközben az elutasított bemenetek esetén egyáltalán nem léphet fel hiba.  3.14. deníció (randomizált polinomiális ido). Az RP osztály pontosan azokat az A problémákat tartalmazza, amelyekhez van olyan NPTM M, hogy M mindegyik x 1/2 valószínuséggel  fogadja el, x 3.15. tétel. A

<



A-t legalább

A-t pedig 0 valószínuséggel  fogadja el.

PRIMES a coRP ben van.

A fenti tétel azt mondja, hogy a Miller–Rabin-teszt a prímszámproblémára MonteCarlo-algoritmus. A bizonyítást itt csak vázoljuk. Megmutatjuk, hogy a Miller–Rabin-teszt

PRIMES-t

  egyoldalú hibavalószínuséggel  fogadja el: ha a (binárisan eloállított) n bemeno

érték prímszám, akkor az algoritmus nem válaszolhatja tévesen azt, hogy n nem prímszám. Hogy ellentmondásra jussunk, tegyük fel, hogy n prím, de a Miller–Rabin-teszt azzal a n nem prímszám”. Következésképpen z . 1 mod n áll fenn. Mik −1 ” m 2m 2 m vel x-et a for ciklus minden lefutásakor négyzetre emeljük, modulo n a z , z , . . ., z m

kimenettel áll le, hogy

egymás utáni értékeket vizsgáljuk. Ezen értékek egyikénél sem válaszolja azt az algoritmus, j

2 m

 következik, hogy z hogy n prím. Ebbol

. −1 mod n minden

j, 0

≤ j ≤ k − 1 esetén. Mivel

113

3.3. RSA és faktorizálás

Üzenet

R S

A I

S T

H E

K E

Y T

O P

U B

L I

C K

E Y

C R

Y P

T O

G R

A P

H Y

mb

460

8

487

190

264

643

379

521

294

62

128

69

641

508

173

15

206

cb

697

387

206

449

165

724

631

365

189

600

325

262

332

472

354

665

673

 rejtjelezésre. 3.9. ábra. Példa RSA-val történo

n

k

2 m  z − 1 = 2k m, a kis-Fermat-tételbol ≡ 1 mod n következik (lásd a 3.5. következményt). 2

Ezért z

k−1

m

1 négyzetgyöke modulo n. Mivel n prím, 1-nek modulo n csak két négyzet-

2

tehát z

k −1

±1 mod n,

k −1

. −1 mod n miatt ≡ 1 mod n teljesül. De ekkor megint z 1-nek négyzetgyöke modulo n. Mint − 2 m  megint z fent, ebbol ≡ 1 mod n következik. Ezt a érvet ismételten alkalmazva végül m azt kapjuk, hogy z ≡ 1 mod n, ami ellentmondás. Következésképpen a Miller–Rabin-teszt

gyöke van, nevezetesen a

(lásd a 3.3-2. gyakorlatot). z

m

2

k−2

2

m

m

k 2

minden prímszám esetén helyes választ ad. Ha n nem prímszám, akkor megmutatható, hogy a Miller–Rabin-teszt valószínusége  nem lépi túl az 1/4 küszöböt. Ismételt független teszt kárára, ami mindamellett log n-ben futtatásokkal azt kapjuk, – természetesen a futási ido  polinomiális marad – hogy a hibavalószínuség  tetszolegesen közel kerül nullához. RSA. Bob a p = 67 és q = 11 prímszámokat választja. Így n = 67 · 11 = 737 és  − 1)(q − 1) = 66 · 10 = 660. Ha most Bob a ϕ(n) = 660-hoz a leheto legkisebb kitevot  nyilvános kulcsa az (n, e) = (737, 7) pár. A kiterjesztett euklideválasztja, ami e = 7, akkor az o szi algoritmus Bobnak a d = 283 titkos kulcsot szolgáltatja, és fennáll e · d = 7 · 283 = 1981 ≡ 1 mod 660 (lásd a 3.3-3. gyakorlatot). Amint a 3.1. alfejezetben is tettük, a Σ = {A, B, . . . , Z} ábécét a Z26 = {0, 1, . . . , 25} halmazzal azonosítjuk. Az üzenetek a Σ fölötti szavak, és azonos hosszú-

3.7. példa.

ϕ(n) =

(p

 ságú blokkonként 26-os számrendszerben eloállított számokként kódoljuk. Példánkban a blokkhossz

` = blog26 nc = blog26 737c = 2. Egy b = b1 b2 · · · b` blokkot, amelynek a hossza `, és bi ∈ Z26 , ábrázolja. Az ` = blog26 nc blokkhossz deníció következtében:

0

≤ mb ≤ 25 ·

` X

`−i

26

az mb

=

P`

i=1

bi

·

26

`−i

szám

= 26` − 1 < n.

i=1

 függvénnyel a b blokkot, illetve a megfelelo  mb számot cb Az RSA rejtjelezo  rejtett szöveg ekkor cb sifrírozzuk. A b blokknak megfelelo az

`

hosszúságú blokkokat injektíven képezi le

`+1

=

e

(mb ) mod n szerint

= c0 c1 · · · c` , ahol ci ∈ Z26 . Az RSA tehát

hosszúságú blokkokra. A 3.9. ábrán láthatjuk,

hogy egy 34 hosszú üzenetet 17 darab 2 hosszú blokkba tördeltünk és az egyes blokkokat számokként  blokkot, amely rejtjeleztük. Például az elso

”

 RS”, számmá transzformáltuk a következoképpen:

· 261 + 18 · 260 = 442 + 18 = 460.  eloállíthatjuk 26-os számrendszerben és ` +

nek a 17 és

S”-nek a 18 felel meg, és 17

”

R”-

” A kapott cb számot megint 1 lehet a hossz: cb `−i  blokk 697 = 676 + 21 c · 26 , ahol ci ∈ Z26 (lásd a 3.3-3. gyakorlatot is). Így az elso i=0 i

P` 1

· 262 + 0 · 261 + 21 · 260 , a rejtjelezett szövegben

 BAV” lett belole. ”  blokkot a d A visszafejtés is blokkonként történik. Ahhoz, hogy az elso

 697 visszafejtsük, kiszámoljuk a következot:

 ´ ´

283

0

=

283 titkos kulccsal

mod 737, ismét gyors-hatványozással, a M ´

algoritmus segítségével. Azért, hogy a számok ne legyenek nagyon nagyok, ajánlatos

= 737 redukálni a kapott értékeket.  + 21 + 23 + 24 + 28 , és – amint kívántuk – adódik a következo:

minden szorzásnál modulo n 2

= =

283

697

0

1

3

4

8

 bináris kifejtése 283 A kitevo

≡ 6972 · 6972 · 6972 · 6972 · 6972 ≡ 697 · 126 · 9 · 81 · 15 ≡ 460 mod 737.

=

114

3. Kriptográa

Lépés 1

Aliz

Erik

protokollban

(n, e)

2 3

Bob

 értékeket választja: n = pq, A következo (n, e) nyilvános kulcs és d titkos kulcs,  RSAahogyan Bob tette a 3.8. ábrán lévo

Aláírja az m üzenetet: sigA (m)

=

d

m



mod

n

(m, sigA (m))

4 5

⇒   Aliz aláírását m Ellenorzi sigA (m)

e



mod n segítségé-

vel 3.10. ábra. Digitális aláírás RSA-val.

3.3.2. Digitális aláírás RSA segítségével  RSA nyilvános kulcsú kriptorendszer módosítható úgy, hogy protoA 3.8. ábrán szereplo  od kollként digitális aláírásra alkalmas legyen. Ilyet mutattunk be a 3.10. ábrában. Meggyoz hetünk arról, hogy a protokoll muködik  (lásd a 3.3-4. gyakorlatot). Ez a protokoll érzékeny  nyílt szöaz olyan támadásra, amelynél a támadó maga meg tudja választani a rejtjelezendo veget (választott szövegu  támadás,

chosen-plaintext attacks”). ”

3.3.3. Az RSA biztonsága és lehetséges támadások az RSA ellen  mértékben attól függ, hogy nagy számok Már említettük, hogy az RSA biztonsága dönto nem könnyen faktorizálhatók. Mivel elszánt keresés ellenére sem sikerült ezidáig hatékony faktorizáló algoritmust találni, azt gyanítjuk, hogy ilyen algoritmus nincs, vagyis a faktorizálási probléma nehéz. Erre a sejtésre azonban még nem született bizonyítás. Önmagában ennek a sejtésnek a bizonyításából nem következne, hogy az RSA-rendszer biztonságos. Tudjuk, hogy az RSA feltörése legfeljebb olyan nehéz, mint a faktorizálási probléma, azt  az is, hogy az RSA könnyen azonban nem tudjuk, hogy ugyanolyan nehéz-e. Elképzelheto  n faktorizálása nélkül is. feltörheto Az RSA-rendszer elleni lehetséges támadások listája helyett, amely különben is hiányos lenne, utalunk a további hivatkozásokat tartalmazó idevágó irodalomra, valamint a  ellenintézke3-4. feladatra. Mindegyik eddig ismert RSA elleni támadásra van megfelelo dés, amelyek meghiúsítják, vagy hatástalanítják a támadást, tehát a támadás sikerességének  Foként  a valószínusége  elhanyagolhatóan kicsivé teheto. a p és q prímszámokat, az n mo és a d titkos kulcsot kell megfelelo  gondossággal megválasztani. dulust, az e kitevot Mivel az RSA elleni faktorizálási támadás különösen központi szerepet játszik, bemutatunk egy egyszeru  ilyen támadást, amely John Pollard ( p (p

− 1)-módszer

− 1)-módszerén alapszik. A − 1 prímfakto-

p prímfaktorú összetett n szám esetén akkor muködik,  ha p

rai kicsik. Ekkor ugyanis meg lehet határozni p

− 1 egyik ν többszörösét anélkül, hogy

p-t

ismernénk, és alkalmazhatjuk a kis Fermat-tételt (lásd a 3.5. következményt), amely szerint a

ν



1 mod p minden a egész szám esetén fennáll, amely p-hez relatív prím. Következés-

ν

képpen p egy osztója a

− 1-nek. Ha n nem osztója aν − 1-nek, akkor lnko(aν − 1, n) valódi

osztója n-nek, s így n-et faktorizáltuk. Hogyan lehet meghatározni p − 1 egy

ν többszörösét? Pollard ( p − 1)-eljárása ν számára

azt a számot alkalmazza jelöltként, amely egy választott S korlát alatti összes prímszámhat-

115

3.3. RSA és faktorizálás

Lépés

Aliz

1

Erik

Bob

véletlenszeruen  választ két nagy számot, x-et és y-t, x-et titokban tartja, és kiszámolja az xσy érté-

két

2

(y, xσy)



3

véletlenszeruen 

4 5

kiszámolja a kA

= xσ(yσz)

választ

egy

z

nagy számot, z-t titokban tartja, és kiszámolja az yσz értéket

⇐ yσz érté-

kiszámolja a k B

ket

=

(xσy)σz érté-

ket

3.11. ábra. A kulcscserére vonatkozó,

 ványok szorzataként áll elo:

σ-n alapuló Rivest–Sherman-protokoll.

Y

ν=

q q prím, q

k

≤S S

Ha p

algoritmus kiszámítja lnko(a értékkel.

 egyszeru Más faktorizálási módszer többek között a négyzetes szita. Ez a következo  ötleten alapul. Az n szám faktorizálásához egy bizonyos szitával olyan a és b számokat keresünk, amelyekre: 2

a

≡ b2 2

Következésképpen n osztja az a

mod n

és

a

. ±b mod n .

(3.10)

− b2 = (a − b)(a + b) számot, de nem osztja sem a − b-t, sem

 a + b-t. Így lnko(a − b, n) egy nem triviális tényezoje n-nek. A négyzetes szita mellett vannak  abban a módszerben különböznek, ahogyan a (3.10)-et más szitamódszerek is, amelyek ettol  a és b számokat meghatározzák. Egy példa erre az kielégíto

”

általános számtest-szita”.

Gyakorlatok

3.3-1.? Bizonyítsuk be a 3.13. tételt. Útmutatás. A kis Fermat-tétel 3.5. következményére e d

támaszkodva mutassuk meg, hogy (m ) prímszámok, p

,

q és n

=



e d

m mod p és (m )



m mod q. Mivel p és q e d

 következik az (m ) pq, a kínai maradéktételbol



m

mod n

állítás. 3.3-2.? A 3.15. tétel bizonyításának vázlatában felhasználtuk azt, hogy egy n prímszám esetén 1-nek csak két négyzetgyöke van modulo n, nevezetesen a

±1 mod n. Bizonyítsuk be

ezt. Útmutatás. Használjuk fel azt, hogy r pontosan akkor négyzetgyöke 1-nek modulo n, ha n az (r

− 1)(r + 1) számot osztja.

 3.3-3. a. Mutassuk meg, hogy a 3.7. példában szereplo

ϕ(n) = 660 és e = 7 értékekre a = 283 titkos kulcs adódik, amely

kiterjesztett euklideszi algoritmus segítségével valóban a d 7 mod 660 inverze.

b. Kódoljuk a 3.7. példában a 3.9. ábrabeli nyílt szöveget a

Σ = {A, B, . . . , Z}

ábécé

betuivel  mind a 17 blokk esetén. c. Fejtsük vissza a 3.9. ábrán látható rejtett szövegnek mind a 17 blokkját, és mutassuk meg, hogy az eredeti nyílt szöveget kapjuk vissza. 3.3-4.

 digitális aláírásra vonatkozó RSA Mutassuk meg, hogy a 3.10. ábrában szereplo

protokoll muködik. 

116

3. Kriptográa

3.4. Rivest, Rabi és Sherman protokolljai Rivest, Rabi és Sherman javasoltak kulcscserére és digitális aláírásra protokollokat. A 3.11.  és Sherman tól ered. Könnyen módosítható úgy, hogy ábra kulcscsere protokollja Rivest-tol digitális aláírásra alkalmas legyen (lásd 3.4-1. gyakorlatot). Rivest és Sherman protokollja egy totális, erosen  neminvertálható, asszociatív egyirá értjük. Egy totális (tehát mindenhol deniált) nyú függvényen alapszik. Ezen a következot  N-be képez, pontosan akkor σ függvény, amelyik N × N-bol xσ(yσz) minden x, y, z ∈ N esetén teljesül, ahol a σ(x, y)

asszociatív, ha (xσy)σz

=

jelölés helyett az xσy je-

 a tulajdonságból következik, hogy a protokoll muködik, lölést alkalmaztuk. Ebbol  mert kA

= xσ(yσz) =

(xσy)σz

=

k B miatt Aliz és Bob valójában ugyanazt a kulcsot számít-

ják ki.  neminvertálhatóságot itt nem kívánjuk formálisan deniálni. Tájékoztatásul Az eros annyit mondunk, hogy

σ-t erosen  neminvertálhatónak nevezzük, ha σ nem csupán egyirá-

nyú függvény, hanem akkor sem invertálható hatékonyan, ha a függvényérték mellett ehhez a függvényértékhez tartozó két argumentum egyikét is ismerjük. Ez a tulajdonság megakadályozza azt, hogy Erik y és xσy, illetve yσz ismeretében a titkos x, illetve z számokat ki tudja számolni, amelynek a segítségével a kA

= kB kulcsot könnyen meg tudná határozni.

Gyakorlatok 3.4-1. Módosítsuk Rivest és Sherman 3.11. ábrán látható, kulcscserére vonatkozó protokollját úgy, hogy digitális aláírásra alkalmas protokollt kapjunk.  Rivest–Sherman-protokoll 3.4-2. Melyik közvetlen támadás lenne a 3.11. ábrán szereplo ellen hatásos, és hogyan akadályozhatnánk meg? Útmutatás. Érveljünk a irányú függvény

σ asszociatív egy-

 neminvertálhatóságának” fogalmával, amelyen a protokoll alapszik. eros ”

 neminvertálhatóság” fogalmára. eros ”  Nasszociativitás” fogalmára parciális, N × N-bol ”  függvények számára. Egy ilyen deníciónak nem kell mindenhol érvényesnek be képezo 3.4-3. a. Adjunk formális deníciót az b. Adjunk formális deníciót az

Egy (esetleg parciális) σ : N × ” N → N függvényt asszociatívnak nevezzük, ha xσ(yσz) = (xσy)σz minden olyan x, y, z ∈ N esetén érvényben van, amikor az (x, y), (y, z), (x, yσz) és (xσy, z) párok mindnyájan σ  deníció kísérletnél: lennie. Mi okoz gondot a következo

értelmezési tartományában vannak.”  denícióját találjuk Hemaspaandra munÚtmutatás. Ezeknek a fogalmaknak kielégíto kájában.

3.5. Interaktív bizonyítási rendszerek és zéró ismeret 3.5.1. Interaktív bizonyítási rendszerek, ArtúrMerlin-játékok és zéróismeret¶ protokollok Az a probléma, amelyet a Diffie–Hellman-protokoll elleni

középen állás támadásnál” a ” 3.2. alfejezetben említettünk, nyilvánvalóan abból adódik, hogy Bob a protokoll lejátszása  nem gyoz  odött   partnere valódi kilétérol.  Bob azt hiszi, hogy Alizzal elott meg beszélgeto hajtja végre a protokollt, a valóságban azonban Erikkel. Másképpen megfogalmazva Aliz-

3.5. Interaktív bizonyítási rendszerek és zéró ismeret

117

 nak az a feladata, hogy Bobot kétséget kizáróan meggyozze személyazonosságáról. A kriptográának ezt a feladatát személyazonosításnak nevezzük. A digitális aláírással szemben, amely az elektronikus úton közvetített dokumentum, mint például az e-mail valódiságát hi van szó, akik a protokollban a részttelesíti, most azoknak a személyeknek a hitelesítésérol  felek. Ennek a fogalomnak további értelmezése is van: vevo

 személy”, vagy résztvevo” ” ”  személy lehet, hanem például egy számítógép, amelyik egy másik számínem csak egy élo tógéppel automatikusan lefolytat egy protokollt. Önmaga hitelességének bizonyítására Aliz felhasználhatna egy csupán általa ismert titkos adatot, mondjuk a PIN kódját (Personal Identifaction Number), vagy más információt,

 Aliz kénytelen titkát Bobnak amit rajta kívül más nem ismer. Itt azonban van egy bökkeno. elárulni személyazonossága valódiságának bizonyítására. Ekkor azonban az nem lesz többé már titok. Bob egy harmadik féllel lefolytatott protokoll során közölhetné mondjuk Kris Aliz, mert már ismeri Aliz titkát. Az a kérdés tehát, hogyan bizonyíthatná az tóffal, hogy o  van szó a ember egy titok ismeretét anélkül, hogy magát a titkot elárulná. Pontosan errol zéró-ismeretu  protokollokban. Ezek speciális interaktív bizonyítási rendszerek, amelyeket  Goldwasser, Micali és Rackoff vezettek be. Tolük függetlenül fejlesztette ki Babai és Moran az ezzel lényegében ekvivalens Artúr–Merlin-játékok tervét, amelyet most informálisan leírunk. A hatalmas Merlin varázsló, akit egy M NP gép reprezentál, és a bizalmatlan Artúr király, akit egy A randomizált polinomideju  gép reprezentál, közösen meg akarnak oldani egy L problémát, tehát el akarják dönteni, hogy egy x bemenet L-hez tartozik-e, vagy sem.  adatért játszanak, miközben felváltva lépnek. Merlin szándéka mindig Mindegyik bemeno   szavuk L-hez tartozik, függetlenül az, hogy Artúrt meggyozze arról, hogy a közös x bemeno attól, hogy ez valóban így van-e. Merlin egy lépése az x ∈ L” (állítólagos) bizonyítására ” vonatkozó adat. Ezt megkapja egy M(x, y) szimulációval, ahol x a bemenetet és y az eddigi lépéseket kódolja. Az y szó tehát leírja az M eddigi nemdeterminisztikus választásait, illetve A eddigi véletlen választásait. Artúr király azonban bizalmatlan. A hatalmas varázsló állítólagos bizonyítását termé szetesen nem tudja közvetlenül ellenorizni, ehhez nincs meg a számítási ereje. Kétségbe tudja azonban vonni Merlin bizonyítását, és képes egy ügyes kihívással válaszolni, amely  taben a Merlin szolgáltatta bizonyítás véletlenszeruen  választott részleteihez ellenorizhet o  valószínuséggel núsítványt követel. Hogy Artúrt kielégítse, Merlinnek lenyugöz  o  meg kell  gyoznie   Artúr egyik lépése tehát abból áll, hogy A(x, y) ot bizonyításának helyességérol. számításokat szimuláljon, ahol x megint a bemenetet, y pedig a játék eddigi lefutását írják le.  váltakozva egzisztenciális és valószínuAz Artúr–Merlin-játék gondolata kifejezheto   ségi kvantorokkal, ahol az elobbiek Merlin NP-számítását, az utóbbiak pedig Artúr randomizált polinomiális számításait formalizálják.

4

Ilyen módon bonyolultsági osztályok hie-

rarchiáját deniálhatjuk, az úgynevezett Artúr–Merlin-hierarchiát. Itt az MA osztály deníciójára szorítkozunk, ez egy olyan két lépéses Artúr–Merlin-játéknak felel meg, amelynél  Merlin lép eloször. 3.16. deníció (MA az Artúr–Merlin-hierarchiában). Az MA osztály pontosan azokat az L problémákat tartalmazza, amelyekre van egy M NPTM és egy A randomizált polinomideju 

4

 Ez hasonlít a polinomiálisido-hierarchia lépéseinek

 a 4.4. alfejezetet és foként a 4.16. tétel 3. részét).

∃ és ∀ kvantorokkal váltakozva történo jellemzéséhez, (lásd

118

3. Kriptográa

Turing-gép, hogy minden x bemenetre fennáll:



Ha x



L, akkor van egy olyan y út M(x)-ben, hogy A(x, y)

elfogad, (vagyis Arthur Merlinnek az megcáfolni, és Merlin nyer).



Ha x

<

”

x



L, akkor M(x) mindegyik y útját A(x, y)

Artúrt Merlin

x





3/4 valószínuséggel 

L”-re vonatkozó y bizonyítását nem tudja

≥ 3/4 valószínuséggel  elutasítja (vagyis

L”-re vonatkozó hamis bizonyítása nem téveszti meg, és nyer).

” Ennek megfeleloen  lehet deniálni az AM, MAM, AMA, . . . osztályokat (lásd a 3.5-1. gyakorlatot). A 3/4 valószínuségi  küszöb a 3.16. denícióban, amely szerint Artúr elfogad vagy elutasít, önkényesen lett megválasztva, és eleinte nem tunik  elég nagynak. Valójában lehet nö velni a siker valószínuségét,  és 1-hez tetszolegesen közel hozni. Másként megfogalmazva, a denícióban alkalmazhatunk 1/2

 + ε valószínuséget  egy tetszoleges rögzített ε > 0 kons-

tanssal, s így még mindig ugyanazt az osztályt kapjuk. Továbbá ismert az, hogy a lépések egy konstans száma esetén ez a hierarchia beleolvad az AM osztályba ( stabilizálódik”): ” NP ⊆ MA ⊆ AM = AMA = MAM = · · · . Az a kérdés azonban még nyitott, hogy az NP

⊆ MA ⊆ AM tartalmazás valódi-e. A fent említett interaktív bizonyítási rendszerek az Artúr–Merlin-játékok változatai.

Jelentéktelen különbség a terminológiában az, hogy Merlin az

igazoló”, Artúr pedig az ”  o”,   ellenorz és a kommunikáció nem játékként zajlik, hanem protokoll formájában. Elso ”  különbség, hogy Artúr véletlen bitje nyilvánosan pillantásra a két modell között az a jelentos   o  véletlen bitje az – és elsosorban Merlin számára – ismert, ezzel ellentétben az ellenorz interaktív bizonyítási rendszerekben titkos. Goldwasser és Sipser megmutatták azonban, hogy valójában lényegtelen az, hogy a véletlen bit titkos, vagy nyilvános. Tehát az Artúr– Merlin-játékok és az interaktív bizonyítási rendszerek egymással ekvivalensek. Ha a játékban konstans számú lépés helyett polinomiálisan sokat engedünk meg – és  többet a polinomiális idokorlátozás miatt nem lehet –, akkor az IP osztályt kapjuk. Dení  ció szerint IP tartalmazza az egész NP-t, és foként a grázomorzmus-problémát. Késobb látni fogjuk, hogy IP tartalmaz coNP

= {L | L ∈

 felNP}-beli problémákat is, amelyekrol

 tesszük, hogy nincsenek NP-ben. A 4.21. tétel bizonyítása elsosorban azt mutatja meg, hogy a grázomorzmus-probléma komplementere AM-ben és így IP-ben van. Shamir egyik híres eredménye azt mondja, hogy IP még PSPACE-szel is megegyezik, azon problémák osz tályával, amelyek a polinomiális térben eldönthetok.  Térjünk azonban vissza a hitelesség elobb vázolt problémájához, és a zéró-ismeretu  protokollok fogalmához. Nézzük az alapgondolatot. Tegyük fel, hogy Artúr és Merlin egyik játékukat játsszák. Az interaktív bizonyítási rendszerek terminológiája szerint ebben az IPprotokollban Merlin nehéz bizonyítást küld Artúrnak. Hogy honnan varázsolta ezt a bizo ismeri, ezzel hitelesíteni tudja magát Artúr elott.  nyítást, az Merlin titka, és mivel csak o Amit egyikük sem tud: a gonosz varázsló Marvin varázsital segítségével Merlin ha sonmásává változott, és Artúr elott Merlinként akarja kiadni magát. Merlin titkát azonban nem ismeri. Hasonlóképpen nincs meg neki Merlin hatalmas varázslóereje sem, mágiája nem nagyobb, mint egy közönséges randomizált polinomideju  Turing-gép számítási ereje. Ugyanolyan csekély, mint amennyire Artúr képes Marvinnak Merlin-bizonyítást találni. Ennek ellenére megkísérli, hogy a Merlin és Artúr közötti kommunikációt szimulálja. Egy IP-protokoll pontosan akkor zéró-ismeretu,  ha az az információ, amely Marvin és Artúr között kicserélésre kerül, nem különbözik a Merlin és Artúr közötti kommuniká-

119

3.5. Interaktív bizonyítási rendszerek és zéró ismeret

ciótól. Ekkor Marvin, aki Merlin titkos bizonyítását nem ismeri, természetesen nem tud róla a szimuláló protokollba semmiféle információt sem áramoltatni. Bár abban a helyzetben  van, hogy az eredeti protokollt pontosan lemásolta, úgy, hogy egy független meggyelo semmiféle különbséget nem tudna felfedezni, a protokoll semmilyen információt nem tud közölni: Ahol nincs, ott ne keress! 3.17. deníció (zéró-ismeretu  protokoll). L



IP esetén legyen M NPTM és A pedig ran-

domizált polinomideju  Turing-gép úgy, hogy (M, A) interaktív bizonyítási rendszer L számára. Az (M, A) IP-protokoll pontosan akkor zéró-ismeretu  protokoll L számára, ha van

b randomizált polinomideju Turing-gép, hogy ( M b, A) az (M, A) eredeti protokollt egy olyan M szimulálja, és minden x



b, A)-beli kommunikációt L esetén az (M, A)-beli, illetve az ( M

b1 , m b2 , . . . , m bk ) sorozatoknál azonos a pénzfeldobás elreprezentáló (m1 , m2 , . . . , mk ) és (m oszlása. A fent deniált fogalmat az irodalomban úgy nevezik, hogy tökéletes zéró ismeret ”  becsületes igazolóval” (honest-verier perfect zero-knowledge). Ez a következoket jelenti:  o  Artúr becsületes (aminek nem feltétlenül kell teljesülnie (a) feltesszük, hogy az ellenorz a kriptográai alkalmazásokban), és (b) megkívánjuk, hogy a szimuláló protokollban közölt információ tökéletesen megegyezzék az eredeti protokollban közölt információval. Az  feltétel némileg idealista, a második alkalmasint túl szigorú. Ezért vizsgálják a zéróelso  megjegyzéseket). ismeretu  protokollok más változatait (lásd a fejezet végén levo

3.5.2. Zéró-ismeret¶ protokoll gráfizomorfizmusra GI NP-ben van, a komplementer GI, AM-ben (lásd a 4.21. tétel bizonyítását). Így mindkét probléma IP-ben van. Most adunk egy zéró-ismeretu  protokollt GI-re. Bár manapság nincs hatékony eljárás GI-re, Merlin meg tudja oldani ezt a problémát, mert GI NP-ben van. Jóllehet nem szükséges, hogy ezt tegye. Megteheti, hogy egyszeruen  választ egy nagy G 0 gráfot, amelynek n csúcsa van, valamint véletlenszeruen  egy π ∈ Sn  permutációt, és eloállítja a G 1 = π(G 0 ) gráfot. A (G 0 , G 1 ) párt nyilvánosságra hozza, a G 0 és G 1 közötti π izomorzmust saját információjaként titokban tartja. A 3.12. ábra mutatja a Most egy konkrét példát vizsgálunk. Már említettük, hogy probléma pedig

Merlin és Artúr közötti IP-protokollt. Természetesen Merlin nem küldheti el Artúrnak egyszeruen 

π-t, mert akkor elárulná a

titkát. Annak bizonyítására, hogy az adott G 0 és G 1 gráfok valóban izomorfak, Merlin vá ρ izomorzmust és egy a bitet, és eloállítja  egy kihívással válaszol: küld Merlinnek = ρ(Ga ) gráfot. Ezután elküldi Artúrnak H-t. O  egy véletlenszeruen  egyenletes eloszlással választott b bitet, és követel tole egy σ izomorzmust G b és H között. Ezt pontosan akkor fogadja el Artúr, ha Merlin σ-jára valóban teljesül σ(Gb ) = H. A protokoll muködik,  mert Merlin ismeri saját titkos π izomorzmusát és véletlenszeruen  választott ρ permutációját. Nem okoz problémát Merlinnek, hogy kiszámolja a σ  hitelesítse magát. A π titkot azonban nem árulja izomorzmust G b és H között és Artúr elott laszt véletlenszeruen  egyenletes eloszlással egy aH

el. Mivel G 0 és G 1 izomorfak, Artúr 1 valószínuséggel  elfogad. Itt egyáltalán nem kell vizs gálni két nem izomorf gráf esetét, mivel Merlin a protokollnak megfeleloen izomorf G 0 és G 1 gráfokat választ (lásd a 4.21. tétel bizonyítását is).  Merlinként kiadni. Ismeri a G 0 és Tegyük fel, hogy Marvin szeretné magát Artúr elott

120

3. Kriptográa

Lépés 1

2

Merlin

Artúr

ρ véletlen permutációt V (G0 )∈ {0, 1} bitet, kiszámolja H =

választ egy ra és egy a

ρ(Ga )-t

H

⇒ választ egy b ∈ {0, 1} véletlen bitet, majd G b és H között követel egy izo-

3

4 5

kiszámolja a

σ

izomorzmust

σ(Gb ) =

⇐b

morzmust

H-

val:

= a, akkor σ = ρ; = b , a = 1, akkor σ = πρ; −1 ha 1 = b , a = 0, akkor σ = π ρ. ha b ha 0

σ⇒

6

 ellenorzi, hogy

7

σ(Gb ) =

H, és akkor

fogadja el, ha ez teljesül 3.12. ábra. Goldreich, Micali és Wigderson

Lépés 1

Marvin

Artúr

ρ véletlen permutációt V (G0 )a ∈ {0, 1} bitet, kiszámolja H =

választ egy ra, és egy

2

GI-re vonatkozó zéró-ismeretu protokollja.

ρ(Ga )-t

H



3

választ egy b

∈ {0, 1}

véletlen bitet,

és követel egy izomorzmust G b és

⇐b

4 5

ha b

,

H között

b kitöröl minden ebben a a, akkor M

körben eddig közvetített információt és ismétel; ha b

b elküldi σ = ρ-t = a, akkor M

σ⇒

6 7

b

=

a esetén

σ(Gb ) =

H, ezért Ar-

túr elfogadja Marvin hamis személyazonosságát 3.13. ábra. A

GI-re vonatkozó zéró-ismeretu protokoll szimulációja π ismerete nélkül.

π izomorzmust. Mégis szeretné színlelni, hogy ismeri π-t. Ha az Artúr által választott b bit véletlenül megegyezik az a bittel, amelyet Marvin elore  −1  nyer. Ha azonban b , a, akkor a σ = πρ vagy σ = π ρ kiszámítása határozott meg, akkor o igényli π ismeretét. Mivel GI egy randomizált polinomideju  Turing-gép számára túl nehéz,

G 1 gráfokat, de nem ismeri a titkos

és hatékonyan nem számítható ki, Marvin elég nagy G 0 és G 1 gráfok esetén nem tudja

π-t, csak találgathat. Az o esélye arra, = a, legfeljebb 1/2. Természetesen Marvin  sikervalószínusége mindig találgathat, és így az o  pontosan 1/2. Ha Artúr azt kívánja, hogy

meghatározni a

π

izomorzmust. Nem ismerve a

hogy véletlenül elcsípjen egy b bitet, amelyre b

r független körben végezzék el a protokollt, akkor a csalás valószínusége  a 2 szorítható le. Ez már r

=

−r

értékre

 20 esetén is elenyészoen csekély: Marvin sikervalószínusége 

kisebb, mint egy a millióhoz.  protokoll valóban zéró-ismeretu  Meg kell még mutatnunk, hogy a 3.12. ábrán szereplo protokoll. A 3.13. ábrán látható egy szimuláló protokoll Marvinnal, aki Merlin

π titkát nem

ismeri, de azt színleli, hogy ismeri. Az az információ, amelyik a protokoll egy lefutása alatt kicserélésre kerül, a (H, b, σ) hármasként adható meg. Ha Marvin véletlenszeruen  választ egy a bitet, és a

=

b, akkor egyszeruen  elküldi

σ = ρ-t

és nyer: Artúr, vagy bárki más

 nem tud semmilyen szabálytalanságot felfedezni. Másrészt, ha a független meggyelo

, b,

121

3. Feladatok

 Marvin csalása leleplezodik. Ez azonban nem okoz gondot az álnok varázslónak: egyszeruen  kitörli a szimuláló protokollból ezt a kört és újra próbálkozik. Így (H, b, σ) formájú  hármasok sorozatát tudja eloállítani, amelyek a Merlin és Artúr közötti eredeti protokoll  sorozataitól megkülönböztethetetlenek. Így Goldreich, Micali hármasaiból álló megfelelo és Wigderson

GI protokollja zéró-ismeretu protokoll.

Gyakorlatok

3.5-1. Deniáljuk az Artúr–Merlin-hierarchia AM, MAM, AMA, . . . osztályait a 3.16. deníció MA osztályához hasonlóan.  3.5-2. Melyik osztályt kapjuk egy olyan Artúr–Merlin-játékban, amelyik csak egy lépésbol áll, amelyet Merlin, illetve amelyet Artúr végez? 3.5-3. Folytassuk le a 3.12. ábrán látható zéró-ismeretu  protokollt a G 0 gráfok, valamint a G és H közötti

π=

(13

=

G és a G 1

=

H

) izomorzmus esetén, ahol G és H a 3.1.3. 2

2 3 4 5 4 1 5

pontban a 3.4. példabeli gráfok. Játsszuk le ezt az Artúr–Merlin-játékot egy magunk választotta

ρ izomorzmussal a ∈ {0, 1} és b ∈ {0, 1} mindegyik változatára. Ismételjük meg ezt a ρ izomorzmussal, amelyet valaki más választott.

játékot egy számunkra ismeretlen

−10

3.5-4. Módosítsuk a 3.12. ábra protokollját úgy, hogy Marvin csalásvalószínusége  a 2

érték alá kerüljön. Adjuk meg ennek a valószínuségnek  egy formálisan helyes elemzését.

Feladatok Z k maradékosztálygyur  uben  ∈ N és x, y, z ∈ Z. Azt mondjuk, hogy x kongruens y-nal modulo k (röviden: x ≡ y mod k), ha k osztja az y − x különbséget. Az x + kZ = {y ∈ Z | y ≡ x mod k} halmazt x mod k vett maradékosztályának nevezzük. Például 3 mod 7 maradékosztálya a 3 + 7Z = {3, 3 ± 7, 3 ± 2 · 7, . . .} = {3, 10, −4, 17, −11, . . .}

3-1. Aritmetika a Legyenek k

halmaz. Egy x mod k maradékosztály reprezentánsa legyen mindig a legkisebb természetes szám x

+ kZ-ben;

például 3 reprezentálja a 3 mod 7 maradékosztályt. Az összes mod k

Zk = {0, 1, . . . , k − 1}. Zk -n deniálunk összeadást az + kZ) + (y + kZ) = (x + y) + kZ és szorzást az (x + kZ) · (y + kZ) = (x · y) + kZ szabályok segítségével. A modulo 7 vett aritmetikában például (3 + 7Z) + (6 + 7Z) = (3 + 6) + 7Z = 2 + 7Z és (3 + 7Z) · (4 + 7Z) = (3 · 4) + 7Z = 5 + 7Z. vett maradékosztály reprezentánsa (x

Bizonyítsuk be, hogy modulo k aritmetikát alkalmazva: a.

(Zk , +, ·) kommutatív egységelemes gyur  u; 

b.

A 3.3. példában deniált

c.

(Z p , +, ·) minden p prímszám esetén test. Milyen struktúra (Z p

Z∗k

halmaz multiplikatív csoport;



∪ {0}, +, ·),

ha p prím-

szám? d.

Bizonyítsuk be, hogy egy csoport semleges eleme, valamint minden csoportelem inverze egyértelmuen  meghatározott.

e.

R gyur  u  invertálható elemei csoR úgynevezett egységcsoportját. Mi a Zk gyur  u  egységcsoportja? a Zk maradékosztálygyur  u  nullosztóit. Mutassuk meg, hogy Zk -ban

Mutassuk meg, hogy egy kommutatív egységelemes portot alkotnak, az

f.

Határozzuk meg

nincs nullosztó, ha k prímszám.

122

3. Kriptográa

3-2. Faizomorzmus Speciális gráfosztályok esetén, például a fák osztályában, a

GI probléma hatékonyan meg-

 körmentes gráf, ahol egy kör egymásután követoldható. Egy (irányítatlan) fa összefüggo,  élekbol  áll, úgy, hogy a kiindulási csúcsba visszatérünk, és minden csúcs legfeljebb kezo egyszer szerepel benne. Egy fa levelei az 1-fokú csúcsok. Tervezzünk hatékony algoritmust a faizomorzmusra, amely P-ben van. Ezt a problémát így deniáljuk:

TI

=

{(G, H) | G és H izomorf fák} .

 számsorozatokkal, és Útmutatás. Jelöljük meg fokozatosan az adott fák csúcsait megfelelo  sorozatokat. Kezdjük a levelekkel és mindegyik lépésben hasonlítsuk össze a kapott jelölo  lépésre haladjunk a fa belseje felé, amíg az összes csúcsot meg nem jelöltük. lépésrol 3-3. Determináns számítása Írjuk meg egy olyan algoritmus pszeudokódját, amelyik egy mátrix determinánsát haté konyan kiszámítja. Ültessük át az algoritmust egy tetszoleges programnyelvre. Ki lehet-e hatékonyan számítani egy mátrix inverzét? 3-4. Alacsony kitevoj  u  támadás

a.

A 3.8. ábrán látható RSA-rendszerben az e

=

 hatékonysági okok miatt nép3 kitevo

szeruségnek  örvend. Ez azonban veszélyes lehet. Tegyük fel, hogy Aliz, Bob és Kristóf ugyanazt az m üzenetet ugyanazzal a nyilvános e

=

  3 kitevovel, de esetleg különbözo

 rejtett szöveget: nA , n B és nC modulusokkal rejtjelezik. Erik elcsípi a három keletkezo ci

=

3

m

mod ni , ahol i

∈ {A, B, C }.

Ezután Erik az m üzenetet könnyen vissza tudja

fejteni. Hogyan?  számára Útmutatás. Erik ismeri a kínai maradéktételt. Egy javasolt érték a kitevo  = 216 + 1, amelynek bináris eloállításában csak két  ´ algoritmus nagyon gyorsan feldolgozza. ´ e

b.

egyes van, s így a M ´

A fent leírt támadásokat ki lehet terjeszteni k darab olyan rejtett szövegre, amelyek egymással kapcsolatban vannak. Legyenek ismertek valamilyen ai és bi 1 értékek, és tegyük fel, hogy k darab ci mindegyiket el is fogták, ahol k

>

e(e

= (ai m + + 1)/2 és



i



k

e

bi ) mod ni üzenetet küldtek el és min(ni )

>

2

e

2 . Hogyan tudja egy

támadó kideríteni, hogy mi az eredeti m üzenet? Útmutatás. Az úgynevezett rácsredukciós technikával (lásd például Miccianció és Goldwasser cikkét). c.

Hogyan lehet ezt a támadást elhárítani?

Megjegyzések a fejezethez Diffie és Hellman nyilvános kulcsú kriptográáról szóló munkája [111]. Az angol, francia, német és nn nyelvu  szövegek betuinek  gyakoriságáról [407]-ban olvashatunk. Charles

123

3. Megjegyzések a fejezethez

Babbageról Singh ír a könyvében [433]. Claude Shannon korszakalkotó munkája a tökéletes  [426]. Ron Rivest, Adi Shamir és Leonard Adleman [391] titkosságú kriptorendszerekrol  ismert nyilvános kulcsú kriptorendszert. Agrawal, Kayal és munkájukban írták le az elso Saxena[4] munkájukban publikálták azt az eredményt, hogy a

PRIMES = {bin(n) | n prím}

prímszámprobléma a P bonyolultsági osztályba tartozik.  [375]-ben olvashatunk. Rabin és Miller véletlen prímJohn Pollard ( p − 1)-módszerérol tesztje a [330, 381] cikkekben, Solovay és Strassen prímtesztje pedig a [436] cikkben található meg. Választott szövegu  támadásról olvashatunk a [398] dolgozatban. Az RSArendszer elleni lehetséges támadásokról a további utalásokat tartalmazó [55]-ben lehet olvasni. A négyzetes szita leírását megtalálhatjuk például [439]-ben, az szita” leírását pedig az [288] cikkben.

általános számtest”

Stinsonnál [439] olvashatunk arról, hogy ha p és q prímszámok, p e d

 hogyan következik az (m ) kínai maradéktételbol



m

,

q és n

=

pq, a

mod n állítás. A 3.4-3. gyakorlat

 deníciót találunk a [201, 202] munkákban. A zéró-ismeretu megoldásához kielégíto  protokollokat Goldwasser, Micali és Rackoff [162] vezették be. Az Artúr–Merlin-játékok tervét Babai és Moran [23, 24] fejlesztették ki. Goldwasser és Sipser [163] munkájában olvashatunk arról, hogy az interaktív bizonyítási rendszerek esetén lényegtelen az, hogy a véletlen bit titkos, vagy nyilvános. A [425]cikkben található meg Shamir híres eredménye arról, hogy IP PSPACE-szel megegyezik. A

GI

problémára adott zéró-ismeretu  protokoll Goldreich, Micali és Wigderson

munkájáig [160] nyúlik vissza. A faizomorzmusra vonatkozó 3-2. feladathoz lásd [246]-t is. A 3-4. feladatban említett rácsredukciós technikát lásd például [326]-ben. Az itt említett támadás Johan Håstad [186] munkájára nyúlik vissza, és Don Coppersmith [88] javította.  Singh [433] könyve szép bepillantást nyújt a kriptológia fejlodésének történetébe,  kezdve a modern rejtjelezo  eljárásokig. Például ott olvashatjuk, az ókori gyökerektol hogy a brit Állami Kommunikációs Központ (Government Communications Headquarters; GCHQ) egyik különleges egysége, a Kommunikációs-elektronikai Biztonsági Csoport (Communications Electronics Security Group; CESG) azt állítja, hogy Ellis, Cocks és Williamson nevu  munkatársai mind a 3.8. ábrán látható RSA-rendszert, mind a 3.7. ábrabeli Diffie–Hellman-protokollt hamarabb feltalálták, mint Rivest, Shamir és Adleman, illetve hamarabb, mint Diffie és Hellman, érdekes módon fordított sorrendben. Az RSA-rendszer jószerével minden, a kriptográáról szóló könyvben le van írva. Az RSA elleni támadásokról, mint amilyen a 3.3. alfejezetben szerepel, átfogó listát találunk például a [55, 398]  cikkekben. áttekinto Prímszámtesztek, mint amilyen a M–R-algoritmus, valamint faktorizáló algoritmusok szintén sok könyvben megtalálhatók, például [159, 407, 439] -ben.  Az erosen neminvertálható, asszociatív egyirányú függvények fogalma, amelyen az  és Sherman3.11. ábrán látható titkos kulcscserére vonatkozó protokoll alapszik, Rivest-tol tól származik. Ennek a protokollnak a módosítása, amely digitális aláírásra alkalmas, Ra akik [380] munkájukban azt is bebizonyították, hogy binak és Sherman-nak köszönheto, kommutatív, asszociatív egyirányú függvény pontosan akkor létezik, ha P

,

NP. Kétségte-

 len, hogy az általuk konstruált egyirányú függvények sem nem totálisak, sem erosen nem invertálhatók, még P

,

NP fennállása esetén sem. Hemaspaandra és Rothe [202] megmu-

 tatták, hogy totális, erosen nem invertálható, kommutatív, asszociatív egyirányú függvény pontosan akkor adódik, ha P

, NP teljesül (lásd a [46, 201] cikkeket is).

124

3. Kriptográa

Az interaktív bizonyítási rendszerek és zéró-ismeretu  protokollok területére vonatkozólag a legjobb és legátfogóbb forrást Goldwasser, Micali és Rackoff mutatták be [162] munkájukban, ez Goldreich könyvében [159] a 4. fejezet. Hasonlóképpen szép kimutatást találhatunk például Köbler és társai [247] és Papadimitriou [358] könyvében, valamint a  cikkekben. Az Artúr–Merlin-játékokat foként  [158, 161, 398] áttekinto Babai és Moran [23, 24], valamint Zachos és Heller [505] vizsgálták. [159] részletesen foglalkozik a zéró-ismeretu  protokollok olyan változataival, amelyek  található róluk például a technikai részletekben térnek el a 3.17. deníciótól. Némi ízelíto [158, 161, 398] dolgozatokban. A kriptográával foglalkozik magyar nyelvu  könyvében Ködmön József [249], Buttyán Levente és Vajda István [64], valamint Simon Singh [433].

4. Bonyolultságelmélet

A 3. fejezetben kriptográa módszerek és protokollok szempontjából fontos algoritmusokkal ismerkedtünk meg, mint amilyen a square-and-multiply algoritmus. Az algoritmusok  akkor boldogok, ha sikerül egy probléma hatékony megoldását eloállítaniuk.  fejlesztoi Ennek során viszont sok fontos probléma sajnos megmakacsolja magát, és konok módon ellenáll minden kísérletnek, melynek célja hatékony megoldó algoritmus kifejlesztése lenne.  Ilyen problémák például a Boole-kifejezések kielégíthetoség problémája, a párosítás és a grázomorzmus problémái, melyeket a fejezetben részletesen tárgyalunk. A bonyolultságelmélet egyik legfontosabb feladata ilyen és hasonló problémák kiszá akkor elémíthatósági bonyolultság szerinti osztályozása. Miközben az algoritmusfejleszto gedett, ha egy, a problémáját megoldó konkrét algoritmus fejlesztése során – konkrét futási  mellett – meg tud orizni   ido egy, a lehetoségekhez mérten legjobb felso  bonyolultsági kor legjobb alsó korlát meghatározásán fálátot, a bonyolultságelméleti szakember egy leheto radozik. Az algoritmusok elmélete és a bonyolultságelmélet ilyen szempontból kiegészítik  és alsó korlát egybeesik, akkor a problémát osztályoztuk. egymást. Ha a felso Annak bizonyítéka, hogy egy probléma nem oldható meg hatékonyan, gyakran negatív” hatású és egyáltalán nem kívánatos. Van azonban a bizonyításnak egy pozitív ” aspektusa is: a kriptográa tárgykörében (lásd a 3. fejezetet) épp a rossz hatékonyság hiányában vagyunk érdekeltek. Annak bizonyítása, hogy egyes problémák csak rossz hatékonysággal oldhatók meg, mint például a faktorizálás probléma vagy a diszkrét logaritmus, titkosított üzenetek átvitelekor a biztonság növekedését jelentik. A 4.1. alfejezetben lefektetjük a bonyolultságelmélet alapjait, különös tekintettel a P és NP bonyolultsági osztályok denícióira. Nagyon fontos kérdés, hogy ez a két osztály  különbözo-e vagy sem. Ez évtizedek óta a bonyolultságelmélet és az egész elméleti informatika központi kérdése. A mai napig sem a P

 , NP sejtést, sem pedig P és NP egyenlosé-

 ad az NP-teljesség elméletébe, gét nem sikerült bizonyítani. A 4.2. alfejezet rövid bevezetot amely ezzel a kérdéskörrel különösen intenzíven foglalkozik. A leghíresebb NP-teljes problémák egyike a

 SAT, az ítéletlogika kielégíthetoség prob-

lémája: kielégítheto-e  egy adott Boole-formula igazságértékeket behelyettesítve változóiba,

SAT probléma NP-teljessége miatt naSAT hatékony (és determinisztikus) megoldó algoritmussal rendel kezzen. A 4.3. alfejezetben bemutatunk SAT-hoz egy determinisztikus és egy valószínuségi

vagyis igazzá teheti-e valamely behelyettesítés? A gyon valószínutlen,  hogy

 algoritmust, melyek mindketten exponenciális idoben muködnek.  Futási idejük a gyakor szinten tartható még úgy is, hogy ezek az latban fontos bemenetméretek mellett elviselheto

126

4. Bonyolultságelmélet

algoritmusok aszimptotikusan rossz hatékonyságúak, tehát nagyon nagy bemenetekre csillagászati méretu  ráfordítást igényelnek.  A 4.4. alfejezetben újra elovesszük a

GI

grázomorzmus problémát, amit a

3.1.3.

alfejezet 3.8. deníciójában ismertettünk, és a zéró ismeretu  protokolloknál játszott szerepet. Ez a probléma azon NP-beli természetes problémák egyike, melyek valószínuleg  (az  P elfogadhatónak tun  o

,

NP feltevés mellett) nem oldhatók meg hatékonyan, és nem is

NP-teljesek. Ilyen szempontból

GI

különleges helyzetet élvez az NP-beli problémák hal-

 (angolul mazában. Az erre utaló jelek az úgynevezett alsóság-elméletbol

lowness theory”) ” erednek, amit a 4.4. alfejezetben ismertetünk. Többek között megmutatjuk, hogy GI az NP-n belüli alsó-hierarchiában helyezkedik el, ami nagyban valószínusíti,  hogy Ezen kívül megmutatjuk, hogy

GI

GI nem NP-teljes.

az SPP bonyolultsági osztályban fekszik, és ezáltal al-

sóbb ( low”) az ismert valószínuségi  bonyolultságosztályoknál. A formális megfogalmazást ” kerülve egy halmaz alsóbb egy C bonyolultsági osztálynál, ha mint orákulum”, mint jós ” semmiféle hasznos információt nem szolgáltat a C-számítások számára. A fent nevezett következmény bizonyításához, annak belátásához, hogy

GI

alsóbb bizonyos bonyolultsági

osztályoknál, nagyon hasznosnak mutatkoznak egyes csoportelméleti algoritmusok.

4.1. Alapok A bevezetésben említettük, hogy a bonyolultságelmélet többek között alsó korlátok meghatározásával foglalkozik. Ennek nehézsége abban rejlik, hogy nem elég a vizsgált problémát megoldó egyetlen konkrét algoritmus futási idejét elemezni, hanem meg kell mutatnunk,  algoritmus futási ideje legalább akkora, mint hogy a problémát megoldó összes elképzelheto a felmutatott alsó korlát. Ezek közé az algoritmusok közé olyanok is tartozhatnak, melyeket  következoen   lépésként az algoritmus fogalmát formátalán még ki sem találtak, ebbol elso lis és matematikailag pontos módon kell megragadnunk, máskülönben nem beszélhetünk az  algoritmusok összességérol.  elképzelheto  formális algoritmus-modellre tettek javaslatot. Az 1930-as évek óta már sok különbözo Ezek a modellek ekvivalensek egymással olyan értelemben, miszerint bármelyik modell át alakítható egy tetszolegesen választott másik ilyen modellé. Kissé pongyolán fogalmazva ez a transzformáció felfogható mint egyfajta – programnyelvek közti – fordítás. Az eddigi ismert modellek ekvivalenciája alapján az úgynevezett Church-tézis felteszi, hogy minden egyes algoritmusmodell pontosan a - természeténél fogva elég bizonytalanul körülhatárolható -

intuitív kiszámítások” fogalmát írja le. A bonyolultságelméletben használt szokᔠsos algoritmusmodell az 1936-ban Alan Turing (1912–1954) által bevezetett Turing-gép. A Turing-gép a számítógépek egy nagyon egyszeru  absztrakt modellje, melyet a követke zokben szintaxisán és szemantikáján keresztül deniálunk. Eközben egyúttal bevezetünk  kiszámíthatóságelméleti vezérgondolatot: a determinisztikusságot és a nemkét különbözo  determinisztikusságot. Célszeruen  eloször az általánosabb nem-determinisztikus Turing aztán speciális esetként közvetlenül adódnak a determinisztikus gépeket írjuk le, amibol Turing-gépek.  a Turing-gép néhány technikai részletét és muködését Mindenek elott  ismertetjük. Egy Turing-gép rendelkezik k darab mindkét irányban végtelen munkaszalaggal, melyek me   zokre vannak felosztva. A mezokben betuk  (jelek) állhatnak. Azt a tényt, hogy egy mezo üres, egy speciális jellel, a

-szimbólummal

jelöljük. A tényleges számítás a munkasza-

127

4.1. Alapok

véges állapotú vezérlőegység fej

bemeneti szalag I

fej

munkaszalag P S Z T

N P U T

!

I D E A F E L D O L G O Z Á S J Ö N 4.1. ábra. Turing-gép.

lagokon történik. Egy számítás kezdetekor a bemeneti szó egy meghatározott szalagon, a bemeneti szalagon található, aminek minden bemeneti szóhoz nem használt további me zoje a



jelet tartalmazza. A számítás befejeztével az eredmény egy másik meghatározott

szalagon, a kimeneti szalagon jelenik meg. Minden szalaghoz egy-egy író-olvasó fej férhet hozzá, amely a gép minden lépésében felülírhatja az aktuálisan olvasott betut,  ezután el jobbra vagy balra, illetve állva maradhat az aktuális mezon.  mozdulhat egy mezot Eközben  memóriájában (véges állapotú vezéra gép aktuális állapota megváltozhat, melyet a belso loegység,  angolul látható.

1

nite control”) feljegyez. ”

A

4.1. ábrán egy két szalagos Turing-gép

4.1. deníció (a Turing-gép szintaxisa). Egy k szalagos nemdeterminisztikus Turing-gép

= (Σ, Γ, Z, δ, z0 , , F) hetes, ahol Σ a bemeneti ábécé, Γ a munka ábécé (szalagjelek) melyre Σ ⊆ Γ, Z véges állapothalmaz, ahol Z ∩ Γ = ∅, δ : Z × Γk → P(Z × Γk × {L, R, N }k ) az átmenetfüggvény, z0 ∈ Z a kezdoállapot,  ∈Γ−Σ az üres jel és F ⊆ Z a végállapotok halmaza. P(S ) egy S halmaz hatványhalmazát jelöli,

(röviden k-szalagos NTM) egy M

tehát S összes részhalmazának halmazát.

0 ∈ Z, x ∈ {L, R, N } és a, b ∈ Γ mellett (z0 , b, x) ∈ δ(z, a) helyett a rövidített 0 (z , b, x) jelölést is használhatjuk. Ha az aktuális állapot z, a fej pedig egy a feliratú

Minden z, z (z, a)

7→

mezon  áll, akkor a fenti Turing-gép parancs a következo  lépések végrehajtását jelenti:

• • •

a felülírását b-vel,

0

egy új z állapot felvételét és az x

∈ {L, R, N }-nak

megfelelo  fejmozgást, azaz egy mezonyi  lépést balra (L, az angol

left” után), vagy egy lépést jobbra (R, azaz

”  (N mint aktuális mezon

neutral”, semleges).

right”), vagy a fej helyben marad az ”

” A k szalagos determinisztikus Turing-gép (röviden a k-szalagos DTM) speciális esetéhez akkor jutunk, ha a A k

=

δ átmenetfüggvény Z × Γk -ról Z × Γk × {L, R, N }k -ra képez.

1 esetben az 1-szalagos Turing-gépekhez jutunk, melyeket NTM-ként, illetve

DTM-ként rövidítünk. Minden k-szalagos NTM illetve k-szalagos DTM szimulálható meg egy szalagos Turing-géppel, amelynél a számítási ido  legfeljebb négyzete az eredetifelelo

1

Lehetséges további megkötések bevezetése is, például lehet a bemeneti szalag csak olvasható, illetve a kimeneti

szalag csak írható. Hasonlóképp a technikai részletek kidolgozásakor számos további megoldás lehetséges, megkövetelhetjük, hogy meghatározott fejek csak meghatározott irányba mozdulhassanak el, vagy a szalagok csak egyik irányba legyenek végtelenek és így tovább.

128

4. Bonyolultságelmélet

nek. Ésszeru  lehet több szalag használata, amennyiben a hatékonyság szerepét nem hanyagolhatjuk el. A Turing-gépek felfoghatók mint olyan elfogadó automaták, melyek nyelveket (szóhalmazokat) fogadnak el. Emellett a Turing-gépek használhatók függvények kiszámításához is.

= (Σ, Γ, Z, δ, z0 , , F) egy NTM. M ∈ Γ∗ Z Γ∗ szó. Ha k = αzβ, akkor αβ jelentése az aktuális szalagfelirat (az aktuális szó a fej által már meglátogatott szalagrészrol),  a fej β elso  szimbólumán 4.2. deníció (a Turing-gép szemantikája). Legyen M

egy kongurációja egy k

áll, z pedig az M aktuális állapota.

K M = Γ∗ Z Γ∗ halmazára deniálunk egy ` M bináris relációt, amely 0 a k ∈ K M kongurációból k ∈ K M kongurációba vezeto  átmenetet írja le a δ átme∗ netfüggvény segítségével. Legyen minden α és β Γ -beli szóra, ahol α = a1 a2 · · · am és β = b1 b2 · · · bn , m ≥ 0, n ≥ 1 és minden z ∈ Z-re:  0 0  a a · · · am z cb2 · · · bn , ha (z, b1 ) 7→ (z , c, N), m ≥ 0 és n ≥ 1 ,    1 2 0 0 a1 a2 · · · am cz b2 · · · bn , ha (z, b1 ) 7→ (z , c, R), m ≥ 0 és n ≥ 2, αzβ ` M     a a · · · a z0 a cb · · · b , ha (z, b ) 7→ (z0 , c, L), m ≥ 1 és n ≥ 1. M kongurációinak

1

m−1

2

m

2

n

1

Megvizsgálandó még két speciális eset: 1.

7→ (z0 , c, R) (tehát M 0 akkor a1 a2 · · · am zb1 ` M a1 a2 · · · am cz .

2.

Ha m

Ha n

=

1 és (z, b1 )

=

7→ (z0 , c, L) (tehát ` M z0 cb2 · · · bn .

0 és (z, b1 )

akkor zb1 b2

· · · bn

jobbra mozdul és egy

-szimbólumot

talál),

M balra mozdul és egy

-szimbólumot

talál),

Az M kezdokongurációja  x bemenet mellett mindig z0 x, az M termináló kongurá-

αzβ alakúak, ahol z ∈ F és α, β ∈ Γ∗ . 0 0 ∗ ∗ Legyen ` M reexív, tranzitív lezártja ` M . Eszerint k, k ∈ K M -re k ` M k akkor és csak akkor, ha létezik egy véges k0 , k1 , . . . , kt K M -beli konguráció-sorozat, melyre ciói x bemenet mellett pedig

k ahol lehetséges, hogy k k0

=

=

k0

= k0 ` M

=

kt

=

k1

`M · · · `M

kt

= k0 ,

0

k . Ha az M kezdokongurációja  x bemenet mellett

0

z0 x, akkor ezt a sorozatot M(x) véges kiszámításának nevezzük, ha a k -beli állapot

végállapot, és azt mondjuk, hogy M megáll az x bemenetre. Az M által elfogadott nyelvet a következoképp  deniáljuk: L(M)

= { x ∈ Σ∗ | z0 x `∗M αzβ, z ∈

F és

α, β ∈ Γ∗ }.

Az M termináló állapotainak F halmazát feloszthatjuk az F a elfogadó végállapotok és a F r

= Fa ∪ Fr és Fa ∩ Fr = ∅. Ebben az esetben = { x ∈ Σ∗ | z0 x `∗M αzβ, z ∈ Fa és α, β ∈ Γ∗ } az M által elfogadott nyelv. ∗ ∗ ∗ Az M kiszámít egy f : Σ → ∆ szófüggvényt, amennyiben minden x ∈ Σ -ra és minden ∗ y ∈ ∆ -ra elutasító végállapotok halmazaira, ahol F L(M)

∈ D f ⇐⇒

1.

x

2.

minden x

M az x bemenet mellett véges sok lépésben megáll,

∈ D f -re:

f (x)

= y ⇐⇒

z0 x

`∗M

zy egy megfelelo  z



F-re,

129

4.1. Alapok

(z0 , a) (z1 , a) (z1 , b) (z1 $)

(z2 , b) (z2 , c)

7→ 7 → 7 → 7 → 7 → 7 →

(z1 , $, R)

(z2 , $)

7→ 7 → (z3 , ) → 7 (z4 , $) → 7 (z4 , ) → 7 (z4 , c) → 7

(z1 , a, R)

(z3 , c)

(z2 , $, R) (z1 , $, R) (z2 , b, R) (z3 , $, R)

4.2. ábra. Az M Turing-gép L

(z2 , $, R) (z3 , c, R)

(z4 , , L) (z4 , $, L)

(z6 , , R) (z5 , c, L)

(z5 , c)

7→ 7 → (z5 , b) → 7 (z5 , a) → 7 (z5 , ) → 7 (z0 , $) → 7 (z5 , $)

(z5 , c, L)

(z5 , $, L) (z5 , b, L) (z5 , a, L)

(z0 , , R) (z0 , $, R)

= {an bn cn | n ≥ 1} nyelvhez tartozó δ parancsai.

ahol D f az f értelmezési tartományát jelöli. Azokat a szófüggvényeket, melyeket egy Turinggép kiszámít, kiszámítható szófüggvényeknek nevezzük. Egy f : mítható, ha egy g : {0, 1, #}



→ {0, 1}



Nk → N függvény kiszá-

,

g(bin(x1 )#bin(x2 )# · · · #bin(xk ))

= bin( f (x1 , x2 , . . . , xk ))

által deniált g szófüggvények segítségével kiszámítható. A bin(n) jelölés az n

∈ N kettes = 10001.

számrendszerbeli ábrázolását jelenti felvezeto  nullák nélkül, mint például bin(17)

 kongurációval rendelkezhet, Mivel egy NTM minden kongurációja több rákövetkezo  ezért természetesen adódik egy kiszámítási fa, melynek gyökere a kezdokonguráció, levelei pedig a termináló kongurációk. A fák speciális gráfok (lásd a 3.8. deníciót a 3.1.3.  állnak. Az M kiszámítási pontban, valamint a 3-2. feladatot), tehát csúcsokból és élekbol

0

fájának csúcsai megfelelnek az M x bemenet melletti kongurációi. Két k és k kongu-

0

ráció között pontosan akkor vezet egy irányított él k-ból k -be, ha k kiszámítási fájában egy k0

`M

k1

`M · · · `M

kt

`M · · ·

`M

0

k . Egy út az M

konguráció-sorozat, tehát M(x)

egy számításának felel meg. Egy NTM kiszámítási fája tartalmazhat végtelen utakat. Egy  DTM esetében a kezdokonguráció kivételével minden kongurációt egyértelmuen  (deter o  kongurációja, ezért a kiszámítási fa elfajul egy minisztikusan) meghatározza a megeloz  lineáris lánccá. A lánc a kezdokongurációval indul, és – amennyiben a gép megáll az adott   esetben pedig a lánc végtelen. bemenetre – a termináló kongurációval végzodik, ellenkezo 4.1. példa.

 L Turing-gép. Legyen egy L nyelv a következo:

= {an bn cn n ≥ 1}.

Egy, az L nyelvet

elfogadó Turing-gép deníciója az M ahol a

= ({a, b, c}, {a, b, c, $, }, {z0 , z1 , . . . , z6 }, δ, z0 , , {z6 }),

δ átmenetfüggvénynek megfelelo Turing-gép parancsok listáját a 4.2. ábra tartalmazza. A 4.3.

 ábra egyenként jellemzi az M állapotait azok jelentésével, valamint a hozzájuk tartozó elvégzendo lépésekkel.

A bonyolultságelmélet szakemberei alapos emberek, szívesen teszik rendbe, foglalják rendszerbe a fontos problémák óriási, változatos halmazát. Ezen cél érdekében osztályoz zák és katalogizálják a problémákat, majd bonyolultsági osztályokba sorolják oket. Minden egyes ilyen osztályba olyan problémák kerülnek, melyek a megoldásukhoz egy meghatározott bonyolultsági mérték szerint nagyjából azonos ráfordításokat igényelnek. A legelterjedtebb bonyolultsági mértékek az idomérték  (egy algoritmus által a megoldáshoz szükséges  lépések száma) és a tármérték (a számítógépen szükséges tárhely). Mi most az idomérték tárgyalására szorítkozunk.

130

4. Bonyolultságelmélet

Z

 Teendo

Jelentés

z0

 kezdoállapot

új ciklust kezdeni

z1

felismertük a-t

 b-t megkeresni a következo

z2

együttesen felismertük a, b-t

 c-t megkeresni a következo

z3

a, b, c ki van írva

z4

jobb oldali szélre értünk

 visszalépni és ellenorizni, hogy minden a, b, c ki van-e írva

z5

a teszt sikertelen

visszalépni a bal szélre és új ciklust kezdeni

z6

a teszt sikerült

elfogadás

megkeresni a jobb oldali szélt

4.3. ábra. Az M állapotainak értelmezése.

 fogalmán az elvégzett lépések száAz algoritmus által a megoldáshoz szükséges ido” ” mát értjük, mint a bemenet méretének függvényét. Formális modellünk, a Turing-gép esetében egy lépés a Turing-gép

δ

átmenetfüggvényének egyszeri alkalmazását jelenti, tehát

 a számítás egy kongurációjának átmenetét a következobe. Esetünkben a hagyományos  legrosszabb eset bonyolultsági modell vizsgálatára szorítkozunk. Ennek megfeleloen egy   Turing-gép idofüggvényéhez a lehetséges tetszoleges n hosszú bemenetek közül azokat a  hatású bemeneteket vizsgáljuk, melyek mellett a gép a legtöbb lépést igényli – tehát a dönto legrosszabb esetet feltételezzük. Ezzel ellentétben átlagos eset bonyolultság esetén egy al goritmus várható futási idejét mint egy (tetszolegesen választott méretu  bemenethez adott)  átlagot kezeljük. valószínuségi  eloszlásnak megfelelo   A következokben deniáljuk a determinisztikus és nemdeterminisztikus idobonyolultsági osztályokat.  4.3. deníció (determinisztikus és nemdeterminisztikus idobonyolultság).



⊆ Σ∗ , valamint legyen x ∈ Σ∗ egy bemenet. Deniál∗ M(x) idofüggvényét,  amely Σ -ból N-be képez a következoképp: 

Legyen M egy DTM, melyre L(M) juk az

( Time M (x)

=

m,

ha M(x) pontosan m

nem deniált

egyébként .

+ 1 kongurációval rendelkezik

N → N függvényt:   max x:| x|=n Time M (x), ha Time M (x) deniált minden    | x| = n méretu  x-re , =     nem deniált egyébként .

Deniáljuk a time M :

time M (n)



⊆ Σ∗ , valamint legyen x ∈ Σ∗ egy bemenet. Deniál∗ juk az M(x) idofüggvényét,  amely Σ -ból N-be képez a következoképp:  ( min{Time M (x, α) | M az α úton elfogadja x-et}, ha x ∈ L(M), NTime M (x) = Legyen M egy NTM, melyre L(M)

nem deniált,

Deniáljuk az NTime M :

ntime M (n)

=

        

egyébként.

N → N függvényt:

max x:| x|=n NTime M (x)

ha NTime M (x) értelmezve van minden olyan x−re, melyre, | x|

nem deniált,

egyébként.

=n,

,

131

4.1. Alapok

t(n) n

n

= 10

n

= 20

n

= 30

n

= 40

n

= 50

n

= 60

.00001 mp

.00002 mp

.00003 mp

.00004 mp

.00005 mp

.00006 mp

2

.0001 mp

.0004 mp

.0009 mp

.0016 mp

.0025 mp

.0036 mp

3

.001 mp

.008 mp

.027 mp

.064 mp

.125 mp

.256 mp

5

.1 mp

3.2 mp

24.3 mp

1.7 perc

5.2 perc

13.0 perc

n

.001 mp

1.0 mp

17.9 perc

12.7 nap

n

.059 mp

58 perc

6.5 év

3855 évszd

n n n 2 3

35.7 év 2

· 108

366 évszd 1.3

évszd

· 1013

évszd

 4.4. ábra. Néhány polinomiális és exponenciális idofüggvény összevetése.



Legyen t egy

N-bol  N-be képezo  kiszámítható függvény. Deniáljuk a determinisztikus

és a nemdeterminisztikus idobonyolultsági  osztályokat t idofüggvény  mellett a következoképp: 

( DTIME(t)

=

NTIME(t)

=

A

(



A

A

=

minden n A

=

)

L(M) egy M DTM-el és

∈ N-re time M (n) ≤ t(n)

L(M) egy M NTM-el és

minden n

∈ N-re ntime M (n) ≤ t(n)

, ) .

Legyen IPol az összes polinom halmaza. Deniáljuk a P és NP bonyolultsági osztályokat a következoképp:  P

=

[ DTIME(t)

és

t∈IPol

NP

=

[

NTIME(t).

t∈IPol

DPTM-el illetve NPTM-el jelöljük a polinomiális ideju  DTM-eket illetve NTM-eket. Miért is olyan fontosak a P és az NP polinom ideju  osztályok? Nyilvánvaló, hogy az ex hatékonynak. A 4.4. ábponenciális futási ideju  algoritmusok általában bajosan nevezhetok  rán összehasonlítjuk néhány polinomiális és exponenciális idofüggvény növekedési ütemét,  indugyakorlati szempontból fontos bemeneti méretekre. Ehhez egy olyan számítógépbol lunk ki, amely másodpercenként egymillió muvelet  elvégzésére képes. Látható, hogy míg a  = 60 méretéig elfogadható ido alatt eloállítják

polinomiális ideju  algoritmusok a bemenet n az eredményt, addig például egy t(n) szerényebb, n

=

=

n

3

futási ideju  algoritmus a bemenet viszonylag

=

30 méreténél 6 évnél is tovább dolgozna, az n

már majdnem 400 évezredre, és körülbelül n

=

40 méretu  problémákhoz

 pedig valóban csillagászati mértéku 50-tol 

 idore lenne szüksége.  o  Az utóbbi évtizedekben a számítógéptudományok és a hardver-technológia meggyoz  fejlodését gyelhettük meg. Ha azonban fel is tesszük, hogy a gyorsabb és gyorsabb processzorok fejlesztési üteme megmarad az eddigi szinten, a 4.5. ábra szerint ez sem segít lényegesen az exponenciális futási ideju  algoritmusok teljes végrehajtási idejének csökkentésében. Mi történne, ha egy olyan számítógépet használnánk, amely 100-szor vagy akár 1000-szer gyorsabb napjaink leggyorsabb számítógépeinél? Egy ti (n), 1

≤i≤

6 függvény-

 hez jelölje Ni azt a maximális feladatméretet, amelyet egy ti (n) idofüggvény u  algoritmus egy órán belül meg tud oldani. A 4.5. ábra alapján látható, hogy még ezerszeres sebességnövekedés is csak körülbelül tízzel növeli N5 értékét t5 (n) 5

egy n

=

n

2

esetén. Ezzel szemben

  idofüggvény u  algoritmus ugyanekkora sebességnövekedést feltételezve hozzáveto-

leg négyszer nagyobb problémákat tud megoldani egy óra alatt.

132

4. Bonyolultságelmélet

ti (n)

Mai számítógép 100-szor gyorsabb 1000-szer gyorsabb

=n 2 t2 (n) = n 3 t3 (n) = n 5 t4 (n) = n n t5 (n) = 2 n t6 (n) = 3 t1 (n)

N1 N2 N3 N4 N5 N6

· N1 · N2 4.64 · N3 2.5 · N4 N5 + 6.64 N6 + 4.19 100

1000

10

31.6

· N1 · N2

· N3 · N4 N5 + 9.97 N6 + 6.29 10

3.98

4.5. ábra. Mi lenne, ha a számítógépek gyorsabbak lennének?

 dogma azt a széles körben elterjedt nézetet fogalmazza meg, miszerint A következo  a polinomiális ideju  algoritmusok hatékonynak tekinthetok, míg a csak exponenciális alsó  algoritmusok kimondottan rosszak, hatékonynak nem nevezhetok.  korláttal rendelkezo 4.4. dogma. A polinomiális ido  a hatékonyság intuitív fogalmának felel meg. Az exponenciális ido  a rossz hatékonyság intuitív fogalmának felel meg. Természetesen egy dogma mindig is csak egy dogma marad, ennélfogva 4.4.-et is kri77

10

tikusan kell szemlélnünk. Egy n nézve egy

N

lépésben dolgozó algoritmus például ugyan formálisan

feletti, polinom lépésszámú algoritmus, de a polinom fokszáma éppen olyan

 összes atom mostanság becsült darabszáma. nagy, mint az egész látható univerzumban lévo Emiatt egy ilyen algoritmus egyáltalán nem hatékony, használata még a legkisebb problé0.00001·n

maméret mellett is gyakorlatilag értelmetlen. Másrészt viszont egy 2

exponenciális

 idokorlát éppenséggel elfogadható lehet a gyakorlatban fontos problémaméretek mellett. Természetesen, ha valamikor is jelentkezik az exponenciális növekedés, a 0.00001

·n

ki-

 esetében ez eloször   tevo csak nagyon nagy n mellett esedékes. Ez a két szélsoséges eset a  A természetes P-beli problémák lenyuvalóságban mindenesetre szinte soha nem fordul elo.   többsége megoldható olyan algoritmussal, aminek futási ideje alacsony fokú polinom, gözo 2

3

mint O(n ) vagy O(n ). Negyed-, ötöd- vagy ennél magasabb fokú polinomok csak nagyon ritkán lépnek fel. A P osztály a 4.4. dogma szerint pontosan a hatékonyan megoldható problémákat tartalmazza. Az NP osztály sok olyan, gyakorlatban fontos problémát tartalmaz, melyekre a  mai napig nem találtak hatékony megoldó algoritmust, mint például a kielégíthetoség és a grázomorzmus problémái. Ezeket a 4. fejezetben részletesen vizsgáljuk. A kérdés, hogy a P és NP osztályok azonosak-e, szintén máig megoldatlan. Ez a híres P–NP probléma, amit tekinthetünk az elméleti informatika legfontosabb máig nyitott kérdésének. A kérdés különösen nagy szerepet játszik a kriptográa területén, mivel a legtöbb ma használatos titkosítási rendszer azon a feltevésen alapszik, hogy bizonyos problémák nehezen megoldhatók. Ide tartoznak a faktorizálási probléma és a diszkrét logaritmus problémája, melyeket a 3. fejezetben vizsgálunk részletesebben. Amennyiben sikerülne a P

 = NP egyenloséget bi-

zonyítani, minden ilyen titkosítási rendszer elvesztené biztonságos tulajdonságát, és ezáltal haszontalanná válna. A P–NP kérdés különösen nagy szerepet játszott az NP-teljesség elméletének létrejöttében. Ez az elmélet módszereket biztosít a legnehezebb NP-beli problémák alsó korlátainak bizonyításához. Egy ilyen bizonyításnál egyetlen egy nehéz NP-beli problémából kell kiindulni. Számos további NP-probléma NP-nehézsége ezután egy visszavezetés segítségével következik, ami során egy problémát egy másikká alakítunk át. Érdekes módon – mivel

133

4.2. NP-teljesség

 ezek visszavezetések – léteznek olyan hatékony algoritmusok, melyekkel lehetové válik a nehéz problémák NP-nehézségének bizonyítása. Azokat a problémákat, melyek NP-beliek és NP-nehezek, NP-teljes problémáknak nevezzük. Ezek nem tartozhatnak P-be, ezért nem is lehetnek hatékonyan megoldhatók, kivéve, ha esetleg P

=

NP fennáll. Az NP-teljesség

elméletét a 4.2. alfejezetben mutatjuk be.

Gyakorlatok 4.1-1. Be lehet-e bizonyítani a Church-tézist? A választ indokoljuk.  M Turing-gépet. 4.1-2. Tekintsük a 4.1. példában szereplo (a) Adjuk meg M kongurációinak sorozatát x

=

3

3

2

a b c

,

illetve y

=

3

3

a b c

3

bemenet

mellett. (b) Bizonyítsuk be M helyességét, azaz igazoljuk az L(M)

 = {an bn cn | n ≥ 1} egyenlo-

séget. (c) Adjunk becslést az M futási idejére.  4.1-3. Mutassuk meg, hogy a 3.8. denícióban szereplo

GI és GA problémák NP-beliek.

4.2. NP-teljesség Az NP-teljesség elmélete módszereket biztosít NP-beli problémák alsó korlátainak igazolásához. Egy NP-probléma NP-ben teljes, ha az osztály legnehezebb problémái közé tartozik. Ennél fogva egy X probléma NP-nehézségének belátásához NP összes problémáját össze kell hasonlítani X-el, és meg kell mutatni, hogy X legalább olyan nehéz, mint az aktuálisan vizsgált másik probléma. Két probléma bonyolultsága polinomiális ideju  visszavezeté össze egymással. A sok különbözoképp  sek segítségével mérheto deniálható visszavezet hetoségi típus közül számunkra most az úgynevezett sok-egy-visszavezethetoség  lényeges, amit

p

≤m -vel

fogunk jelölni. Mivel ebben az alfejezetben nem foglalkozunk más vissza-

 vezethetoségi osztállyal, ezért egyszeruen 

  beszélünk. A 4.4. alfevisszavezethetoség”-r ol ”  jezetben általánosabb visszavezethetoségeket is megismerhetünk, az úgynevezett Turingvisszavezethetoséget  és az (eros)  nemdeterminisztikus Turing-visszavezethetoséget.   4.5. deníció (visszavezethetoség, NP-teljesség). mazra (formálisan A melyre minden x ha minden A



NP-teljes), ha B

p

≤m

∈ Σ∗

esetén x

NP halmazra A p

Egy A halmaz visszavezetheto  egy B hal-

B, ha létezik egy polinomiális idoben  kiszámítható r függvény,



A



p m

⇐⇒

r(x)



B. Egy B halmaz

B. Egy B halmaz

≤m -nehéz NP-ben és B ∈ NP.

p m -teljes



p

≤m -nehéz

NP-ben,

NP-ben (vagy röviden

Egy adott X probléma NP-nehézségének bizonyításhoz látszólag végtelen sok hatékony algoritmus szükséges, majd minden egyes ilyen NP-beli problémát hatékonyan vissza kell  kutatási eredmény szerint azonban nem szükséges végtelen sok vezetni X-re. Egy alapveto ilyen visszavezetés elvégzése, elég egyetlen NP-teljes V probléma visszavezetése X-re. Miaz

p

 ≤m -visszavezethetoség tranzitív (lásd a 4.2-2. gyakorlatot) valamint V NP-nehéz, ezért p p A ≤m V ≤m X visszavezetéssel következik X NP-nehézsége. Itt A befutja az NP-beli

vel a

nyelveket.  ilyen NP-teljes problémák egyikét, az ítélet1971-ben Stephen Cook megtalálta az elso  logikai kifejezések kielégíthetoségének problémáját ( satisability problem”), amit röviden ”  SAT-tal jelölünk. Sok NP-teljességi bizonyításhoz elég, ha a kielégíthetoség probléma egy

134

4. Bonyolultságelmélet

úgynevezett

3-SAT

megszorításából indulunk ki, ahol az adott Boole-formulák konjunktív

normálformában állnak rendelkezésre, és minden klóz pontosan három literált tartalmaz. A

 3-SAT is NP-teljes. A diszjunktív normálformájú Boole-kifejezések kielégíthetoségének

eldöntése hatékonyan megoldható.

 és az  Boole-konstansokat rendre 0∈ {0, 1} minden i-re. A változókat és azok negáltját literáloknak nevezzük. Egy ϕ Boole-formula kielégítheto,  ha létezik ϕ változóinak olyan behelyettesítése, ami a formulát igazzá teszi. Egy ϕ Boole Vn Wk formula konjunktív normálformájú (röviden KNF,) ha ϕ(x1 , x2 , . . . , xm ) = ` i=1 j=1 i, j Wk formájú, ahol az `i, j literálok { x1 , x2 , . . . , xm }-bol  valók. A literálok ` diszjunkcióit ϕ j=1 i, j klózainak hívjuk. Egy ϕ Boole-formula k-KNF, ha ϕ KNF és ϕ minden klóza pontosan k  4.6. deníció (kielégíthetoség probléma). A

val és 1-gyel jelöljük. Legyenek x1 , x2 , . . . , xm Boole-változók, tehát xi

i

i

literált tartalmaz. Deniáljuk a következo  két problémahalmazt:

SAT = 3-SAT =

{ϕ | ϕ kielégítheto KNF Boole-formula} , {ϕ | ϕ kielégítheto 3-KNF Boole-formula} .

 két formula kielégítheto  Boole-kifejezés (lásd még a 4.2-1. 4.2. példa. Boole-kifejezések. A következo gyakorlatot):

Itt

ϕ(w, x, y, z)

=

(x

ψ(w, x, y, z)

=

(¬w

∨ y ∨ ¬z) ∧ (x ∨ ¬y ∨ ¬z) ∧ (w ∨ ¬y ∨ z) ∧ (¬w ∨ ¬ x ∨ z)

;

∨ x ∨ ¬y ∨ z) ∧ (x ∨ y ∨ ¬z) ∧ (¬w ∨ y ∨ z) ∧ (w ∨ ¬ x ∨ ¬z) .

ϕ egy 3-KNF formula, ezért ϕ 3-SAT-beli. Ezzel szemben ψ nem 3-KNF, mivel az elso klóz négy ψ ugyan SAT-beli, de nem 3-SAT-beli.

literált tartalmaz, ezért

 között adott meg A 4.7. tétel Cook korábban említett eredménye, amelyben az elsok

SAT-tal

 egy NP-teljes problémát. A bizonyítás alapötlete szerint kódoljuk egy tetszoleges

M NPTM muködését  egy

ϕ M, x

Boole-formulával úgy, hogy

ϕ M, x

pontosan azon x-ekre le-

 az x bemenettel, melyeket az M elfogad. A kielégíthetoség  gyen kielégítheto problémából kiinduló visszavezetésekhez sokszor célszeru,  ha az adott kifejezések szigorú 3-KNF formában állnak rendelkezésre. Ez megoldható, mivel

SAT visszavezetheto 3-SAT-ra, ezért 3-SAT

 fejezetét). szintén NP-teljes (lásd az Új algoritmusok megfelelo 4.7. tétel (Cook). A

SAT és 3-SAT problémák NP-teljesek.

Napjainkra több ezer NP-teljes problémát találtak már. Mi most a nagy választékból szemléltetési célokra a háromdimenziós párosítás problémát választjuk ki, és egy

3-SAT-

ból való visszavezetéssel megmutatjuk NP-teljességét. A párosítási feladatoknál egymás párokat vagy hármasokat alakítunk ki. Egy kétdimenziós (vagy bipartite) párosítás hoz illo  párok halmaza, egy háromdimenziós (vagy tripartite) párosítás, más néven egymáshoz illo  hármasok halmaza. Kétdimenziós párosítások jól szemléltethehármasítás egymáshoz illo  (irányítatlan) gráfokkal, lásd bovebben  tok a 3.8. deníciót. 4.8. deníció (kétdimenziós párosítás probléma).

Egy 2n csúccsal rendelkezo  G gráf pá-

ros, ha a csúcshalmaza két n méretu,  diszjunkt V1 és V2 halmazra osztható, ahol mindketto  független halmaz, azaz sem V1 , sem pedig V2 csúcsai nincsenek élekkel összekötve. Csak

135

4.2. NP-teljesség

¯ b 1 f2

m1

f3

m2

b1 f1

b2

m2 f2

m1 ¯ b 4

f1

m3

f4

m4

¯ b 2 m3

f4 f3

m4 b4

b3 ¯ b 3

4.6. ábra. Balra: A házasítás probléma megoldása. Jobbra: Az R reláció igazságérték-komponensei.

V1 és V2 -beli csúcsok között fordulhat elo  él. G tökéletes kétdimenziós párosítása egy olyan n csúcsú M (v, x

∈ V1 ,



w, y

{v, w} és { x, y} M-beli élre , y. A kétdimenziós párosítás probléma kérdése az, hogy

E(G) halmaz, melynél minden két különbözo 

∈ W2 ) v ,

x és w

egy adott páros gráfhoz létezik-e kétdimenziós párosítás.

4.3. példa. (Kétdimenziós párosítás probléma.)

Képzeljünk el n darab házasodni szándékozó höl-

gyet és n darab házasodni szándékozó fért, akik egy páros gráf csúcsait alkotják. A V (G) csúcshalmaz tehát két részre bomlik, Vvolegény  V (G)

=

Vmenyasszony

∪ Vvolegény 

= { f1 , f2 , . . . , fn } és Vmenyasszony = {m1 , m2 , . . . , mn }, valamint ∩ Vvolegény = ∅. A Vvolegény -beli és a Vmenyasszony  

és Vmenyasszony

beli csúcsokat élek köthetik össze, de nincs él Vvolegény -beli csúcsok vagy Vmenyasszony -beli csúcsok   ha rendezheto  n darab esküvo  az n menyasszony és között. Egy kétdimenziós párosítás akkor áll elo,   idézve) n volegény között úgy, hogy (Garey és Johnson muvéb  ol

 valamint a poligámia elkerülendo, ” mindenki elfogadható feleséget illetve férjet kapjon”. Emiatt az értelmezés miatt a kétdimenziós párosítás problémát házasítás problémának is nevezzük. A 4.6. ábrán (bal oldalon) látható a házasítás

probléma egy megoldása, ahol a vastagon nyomtatott élek a négy új házaspárt jelölik. Ismert, hogy a házasítás probléma hatékonyan megoldható. A valós élet gyakran igazolja az állítást: Házasodni könnyu! 

 A következokben általánosítjuk a páros gráfokat és a kétdimenziós párosításokat három dimenzióra.

4.9. deníció (háromdimenziós párosítás probléma). Legyen U , V és W három, páronként

⊆ U × V × W egy hármas reláció, tehát (u, v, w) hárma∈ W . R egy háromdimenziós párosítása egy n méretu különbözo  (u, v, w) és (u ˆ, v ˆ , w) ˆ hármasra u , u, ˆ v , v ˆ és

diszjunkt, n méretu  halmaz. Legyen R sok halmaza, ahol u M w

∈ U, v ∈ V

és w

⊆ R halmaz, ahol minden két , w. ˆ Ez azt jelenti, hogy egy háromdimenziós párosítás semelyik két eleme nem illeszked-

het egymáshoz valamely koordinátájában. Deniáljuk tehát a háromdimenziós párosítás

136

4. Bonyolultságelmélet

problémát a következoképp: 

3-DM

     =  (R, U, V, W )   

U , V és W páronként diszjunkt, nem üres, azonos méretu  halmaz és R

⊆U ×V ×W

egy hármas reláció, amely

egy |U | méretu  háromdimenziós párosítást tartalmaz

     .    

4.4. példa. Háromdimenziós párosítás probléma. Kilenc hónap telt el. Egy reggel az n darab boldog   születik, akik hangos sírás házastárspárunk útra kel a kórházba. Néhány órával késobb n csecsemo  mellett rögtön jelentosen megnövelik szüleik életének bonyolultságát például azáltal, hogy elcseré lik a névtáblájukat, amin rajta áll, hogy melyik szülopárhoz tartoznak. Ez nagy zurzavarhoz  vezet  a szüloszobában. Még tovább rontva a helyzeten az újdonsült apák mindegyike – talán az izgalmas  szépségétol  elcsábítva – kijelenti, hogy sosem látta azt a hölpillanatoktól összezavarva és a többi no  gyermekét hozta épp világra. Ehelyett hutlen gyet, aki makacsul kitart amellett, hogy az o  módon  mellett közvetlenül balra fekszik. A káosz kijelenti, hogy egy másik hölgy a házastársa, aki az elso   ovére    teljes! A szüloszoba fon nehéz problémával szembesül: melyik szülopároshoz melyik csecsemo tartozik? Másképp fogalmazva n darab boldog, harmonikus és páronként diszjunkt családot kell újra összeállítania, tehát egy háromdimenziós párosítás feladatot kell megoldania n édesapa, n édesanya és  között. Nem csoda, hogy – szemben a kétdimenziós párosítás feladat hatékony megoldn csecsemo  ovérnek  hatóságával – a 3-DM probléma NP-teljes. Végül a fon 3n darab vérvételt és kinomult DNS teszteket kell elvégeznie, ám ennek tárgyalása már meghaladná könyvünk terjedelmét. Ismét átfogalmazva a 3-DM NP-teljességét a valós élet tapasztalataira: Ha jönnek a gyermekek, nagyon nehéz feladat boldog és harmonikus, diszjunkt családokban élni!

4.10. tétel. A 3-DM probléma NP-teljes. Bizonyítás. A 4.2-4. gyakorlat szerint könnyen belátható, hogy 3-DM NP-beli. A 3-DM NP nehézségének bizonyítása mögötti intuíciót legkönnyebb akkor megérteni, ha eloször meg  ovér  nézzük, hogyan jár el a szüloszobai fon a háromdimenziós párosítás probléma megoldá sakor. Eloször is mindenkit ellát a teremben egy névtáblával, olyannal, ami megbízhatóan nem fog ismét eltunni.  Feltesszük, hogy az édesanyák az m1 , m2 , . . . , mn , az édesapák az  pedig a b1 , b2 , . . . , bn elnevezéseket kapják. Ezután a fon  ovér  f1 , f2 , . . . , fn , a csecsemok ¯ ,b ¯ ,...,b ¯ } csecsemot ¯ a b -vel megegyezo  állít elo,  ahol minden egyes b  egy újabb adag {b 1 2 n i i 2

 klón , azaz ugyanúgy néz ki, és a DNS-e bi -vel azonos öröklodési információkat tartalmaz.  A 2n darab szülo  egy belso  kört formáz, Ezt elvégezve két kört alakít ki a 4n emberbol.  körben az n csecsemo  és n klónja helyezkedik amiben apák és anyák váltakoznak. A külso el, ugyancsak váltakozva. A két kör szomszédos személyei kapcsolatban állnak egymással úgy, ahogy a 4.6. ábra (jobb oldalon) n

= 4 esetében mutatja: minden apa két anyával és két

 csecsemovel van összekötve.  gondolatmenetben az i indexek modulo n értendok,  A következo a példában n 3

Vizsgáljunk minden i-t, melyre i modulo n

= 4. Az

= 4.

fi -edik apa az mi−1 -edik anyával tartja

magát házasnak, és vele közös gyermekének pedig az (i



 Ezzel szemben 1) csecsemot.

az mi anya ahhoz ragaszkodik, hogy o  az fi apa felesége, és a közös gyermekük pedig az  Mindkét ellentmondó állítást egy-egy háromszög szemlélteti a 4.6. ábrán i-edik csecsemo. ¯ (jobb oldalon), melyek csúcsai fi , mi−1 és b i−1 , illetve mi , fi és bi . A 2n darab háromszög

2

  etikai kérdések szintén túlmutatnak A csecsemoklónozás technikai kérdései és az ezzel kapcsolatban felmerülo   ezen könyv határain, ennélfogva szép csendben mellozzük oket. 3

A modulo n aritmetikáját a 3. fejezet végén, a 3-1. példával kapcsolatban ismertettük.

137

4.2. NP-teljesség

 ovérnek  mindegyike egy-egy potenciális családot képez. A fon azt kell megállapítania, hogy mely háromszögek reprezentálják az eredeti n darab családot, és melyek nem. Az egyet len lehetoség n darab diszjunkt család létrehozására az, ha vagy minden háromszögbe egy ¯ klóncsecsemot  vagy pedig minden háromszögbe egy b  választunk. Azáltal, b csecsemot, i

i

 ovér  hogy a 3n vérvételt és a fentebb említett DNS-teszteket elvégezte, a fon meghozhatja  ovér  a helyes döntést és minden apához kijelölheti igazi feleségét és igazi gyermekét. A fon  az n darab eredeti családot. A fennmaradó n darab csecsemot  (és ez a tehát így állítja elo  ovér   fon módszerének szomorú oldala – és a csecsemoklónozásé úgy általában) adoptálják, vagy árvaházakban helyezik el. A bonyolultságelmélettel foglalkozók nem nagyon értenek a DNS-tesztekhez vagy a  klónozáshoz, szerencsére azonban a kielégíthetoség-problémát jól ismerik. A 3-DM prob-

3-SAT egy visszavezetését 3-DM-re. Legyen ϕ(x1 , x2 , . . . , x` ) = C1 ∧ C2 ∧ · · · ∧ Cn , ahol

léma NP-nehézségének belátásához deniáljuk

ϕ

adott

Boole-formula 3-KNF-ben, vagyis

  ϕ minden C j klóza pontosan három literált tartalmaz. Eloállítandó polinomiális idoben egy  ahol R ⊆ U × V × W egy hármas reláció a páronként diszjunkt, (R, U, V, W ) négyes 3-DM-bol, nem üres, azonos méretu  U , V és W halmazokkal úgy, hogy

ϕ kielégítheto ⇐⇒

R egy |U | méretu,  M háromdimenziós párosítást tartalmaz

.

(4.1)

 jellegu  R különbözo  hármasokból áll, melyek mögött mindig más és más szándék rejto zik. Azonos jellegu  hármasokat elem-csoportokká, komponensekké fogunk össze. Az elso

ϕ formula változóinak olyan ϕ összes klózára nézve. Ennek

ilyen komponens azokból az R-beli hármasokból áll, melyek meghatározott hozzárendelését biztosítják, ami konzisztens

   klózokban, akkor minden egyes megfeleloen ha ugyanaz a változó elofordul különbözo  ilyen eloforduláshoz ugyanazt az igazságértéket kell hozzárendelni, ennélfogva ezeket az  igazságérték-komponensnek nevezzük. alkotóelemeket R-bol Minden ϕ-beli xi változóhoz készítünk pontosan 2n darab U -beli b , b , . . . , bn és 1 2 ¯ i pedig ¬ x ¯i , b ¯i , . . . , b ¯ i elemet, ahol n a ϕ klózainak száma. A bi reprezentálja x , a b b i i n j j i

1

i

i

2

ϕ j-edik C j klózában. Mivel az összes literál nem fordul elo minden klózban, i ¯ i nem feleltetheto  meg valamely ϕ-beli literál elofordulásának.  Ezeezért néhány b j vagy b j

 elofordulását

ϕ-beli xi változóhoz létrehozunk további n darab V -beli mi1 , mi2 , . . . , min i i i  belso  kört és n darab W -beli f , f , . . . , fn elemet, melyek a 4.6. ábrán (jobb oldalon) lévo 1 2 alkotják, ha n = 4 és az ábrán nem szerepelnek a fenti indexek. Kapcsoljuk most össze ken kívül minden

i

i

i

i

¯i és b

i j− 1

az m j , f j és b j , továbbá az f j , m

j−1

elemeket egymással, ahogy a 4.6. jobb oldali

ábráján vázoltuk. Az így létrehozott komponensek háromszögei megfelelnek az R hármai

i

 körbol  m és f csak azokban a komponensekben fordulnak elo,  melyek sainak. A belso j j i ¯ i más komponensekben is  körbol  b és b az xi változónak felelnek meg, miközben a külso j j

 elofordulhatnak. Formálisan az X igazságérték-komponensek X Xi

=

Fi

∪ Ti

minden

=

S`

i=1

Xi alakúak, ahol

ϕ-beli xi -re, a következo két halmaz által deniálva:

Fi

= {(bij , mij ,

Ti

¯i (b j

= { i

,

i mj

,

i

fj) | 1 i f j+1 )

≤ j ≤ n} ;

| 1 ≤ j < n} ∪ {(b¯ in , min ,

i

f1 ) }

.

i

 kör m és f elemei csak Xi komponenseiként szerepelhetnek, ezért R minMivel a belso j j  den M párosítása pontosan n darab hármast tartalmaz, vagy minden ilyen hármast F i -bol,

138

4. Bonyolultságelmélet

 Az F i és T i közötti választás biztosítja az xi változók megfevagy minden hármast T i -bol. leltetését az igaz vagy a hamis értékeknek. Mivel Xi tartalmazza

ϕ összes

 xi elofordulását,

ezért ez a választás az egész formulára nézve konzisztens, következésképp R minden egyes M párosítása a

ϕ

formula egy hozzárendelését határozza meg úgy, hogy a hozzárendelés

minden xi változója akkor és csak akkor lehet igaz, ha M

ϕ

=

Sn

∩ Xi = T i .

Y j hármasok halmazát úgy, hogy minden Y j a j=1  C j klózát ellenorizze.   megfelelo Ennek megfeleloen az Y komponenst R kielégíthetoségi Most hozzáillesztjük R-hez az Y



komponensének nevezzük. Minden C j klózhoz készítünk két v j

V és w j



W ele-

 Ezen kívül Y j három további elemet tartalmaz az met, melyek csak Y j -ben fordulnak elo.

 S`  i {b j } ∪ {b¯ ij } halmazból, melyek megfelelnek C j három literáljának, és R más kompoi=1   halmazzal nenseiben is elofordulhatnak. Formálisan Y j -t ϕ minden C j klózára a következo deniáljuk:

{(bij , v j , w j ) | xi

=

Yj

Mivel a v j és w j (1



j

 elofordul C j -ben}



∪ {(b¯ ij , v j , w j ) | ¬ xi

 elofordul C j -ben}

.

 különn) elemek egyike sem szerepelhet az R halmaz Y j -tol

 bármelyik másik hármasában, ezért R minden M háromdimenziós párosítása pontosan bözo i ¯ i , v , w )-t. Továbbá M ponegy Y -beli hármast tartalmaz, vagy (b , v , w )-t, vagy pedig (b j

j

j

j

j

j

j

i

 C j -ben), vagy pedig tosan akkor tartalmaz egy Y j -beli hármast – vagy b j -t (ha xi elofordul ¯ i -t (ha b j

¬ xi fordul elo C j -ben) – ha ez az elem nem fordul elo az M ∩ Xi hármasai között. Ez

pedig pontosan akkor következik be, ha az M igazságérték-komponensével meghatározott hozzárendelés kielégíti a C j klózt. Mostanra U pontosan 2n` elemet tartalmaz, azonban V és W mindössze n`

+ n elemu.  − 1) elemmel V -t és W -t, amivel a három halmaz azonos méretu lesz. hozzáadjuk a vn+1 , vn+2 , . . . , vn` elemeket V -hez, valamint a wn+1 , wn+2 , . . . , wn`

 Bovítsük további n(`  Eloször is

 halmazával: elemeket W -hez. Ezeken kívül kiegészítjük R-et hármasok következo Z

= {(bij , vk , wk ) | 1 ≤ i ≤ ` és 1 ≤ j ≤ n és n + 1 ≤ k ≤ n`} ∪ {(b¯ ij , vk , wk ) | 1 ≤ i ≤ ` és 1 ≤ j ≤ n és n + 1 ≤ k ≤ n`} .

A vicc pedig az, hogy ha létezik R

−Z

egy háromdimenziós párosítása, és az összes,

 R igazságérték- és kielégíthetoségi-komponenseivel biztosított feltétel teljesül, akkor ez a háromdimenziós párosítás U -ból pontosan n(`

− 1)

elemet szabadon hagy, amit aztán egy

egyértelmuen  meghatározott Z-beli (vk , wk ) párral

párosíthatunk”. Az R − Z háromdimen”  ziós párosításainak ilyen bovítése R egy háromdimenziós párosítását adja. Formálisan az U ,

 V és W halmazokat a következoképp deniáljuk: U

= {bij | 1 ≤ i ≤ ` és 1 ≤ j ≤ n} ∪ {b¯ ij | 1 ≤ i ≤ ` és 1 ≤ j ≤ n} ;

V

= {mij | 1 ≤ i ≤ ` és 1 ≤ j ≤ n} ∪ {vk | 1 ≤ k ≤ n`}

W

;

= { f ji | 1 ≤ i ≤ ` és 1 ≤ j ≤ n} ∪ {wk | 1 ≤ k ≤ n`} .

 ⊆ U ×V ×W relációt a R = X ∪Y ∪Z egyenloség határozza meg. Mivel R pontosan 2n`+ 2 3n + 2n `(` − 1) hármast tartalmaz, tehát polinomiális számút a ϕ formula méretére nézve, és  ezért a visszavezetés polinomiális R szerkezete könnyen meghatározható ϕ szerkezetébol,

Az R

  idoben kiszámítható. A (4.1) állítás következik az R konstrukciója közbeni észrevételekbol.

139

4.3. Az ítéletlogika kielégíthetoség-problémája 

(4.1) formális bizonyítását a 4.2-5. gyakorlat keretében az Olvasóra bízzuk.

Gyakorlatok  behelyettesítést a 4.2. példában szereplo  4.2-1. Adjunk meg egy-egy kielégíto

ϕ és ψ Boole-

formulákhoz. 4.2-2. Mutassuk meg az A



p m

p

p

 ≤m -visszavezethetoség tranzitivitását: (A ≤m

B

p

∧ B ≤m

C)

=⇒

C.

4.2-3. Adjunk meg egy

p

SAT ≤m 3-SAT visszavezetést. Alakítsuk át hozzá egy adott Boole-

 vagy háromnál több formula minden olyan klózát KNF klózzá, amely csak egy, csak ketto  literált tartalmaz. Eközben a formula kielégíthetosége ne változzon. 4.2-4. Mutassuk meg, hogy a

SAT és 3-DM problémák NP-beliek.

 (4.1) egyenloséget.  4.2-5. Lássuk be a 4.10. bizonyításban szereplo

4.3. Az ítéletlogika kielégíthet®ség-problémája 4.3.1. 3-SAT determinisztikus id®bonyolultsága  SAT kielégíthetoség probléma és annak 3-SAT megszorítása a 4.7. tétel alapján NP-teljes. SAT esetleg P-beli lenne, akkor az általánosan elfogadott sejtéssel szemben P = NP rögtön következne, ezért nagyon valószínutlennek  tunik,  hogy léteznének SAT-hoz vagy 3-SATA

Ha

hoz hatékony determinisztikus algoritmusok. Akkor viszont mekkora a legjobb algoritmu-

3-SAT-ra? Mivel a formula pontos szerkezete nyilvánvalóan befolyásolhatja 3-SAT problémára koncentrálunk, ahol minden klóz  k-SAT-ra, pontosan három literálból áll. Az itt bemutatott eredmények közvetlenül átvihetok SAT megszorítására pontosan k literállal klózonként. 3-SAT naiv” determinisztikus algorit”  musa a következoképp muködik:  egy adott n-változós ϕ Boole-formulánál egymás után az sok futási ideje

 ezért mi ebben a pontban a futási idot,

összes lehetséges behelyettesítést kipróbáljuk, kiértékelve a formulát a mindenkori értékekkel. Ha n

a 2

ϕ

 esetben mind valamely behelyettesítésre igaz, az algoritmus elfogad, ellenkezo

behelyettesítést eredmény nélkül kipróbálja, és az algoritmus elutasít. Ez a módszer n

 nyilvánvalóan O(2 ) idovel dolgozik. Megoldható-e a probléma gyorsabban?  megmutatnánk hogyan, a következo  kérdést Igen, megoldható gyorsabban is. De mielott szeretnénk feltenni: miért? Mi haszna annak, ha n

valahová O(c )-re, ahol a c konstansra 1

n  3-SAT felso idokorlátját O(2 ) alá szorítjuk,

< c < 2 teljesül, ami még mindig egy exponenciá-

  annak az n0 küszöbértéknek a hátrébb lis idokorlát? A haszon ott jelentkezik, hogy elérheto  jellemzo  lesz, azaz ahol az algoritmus abszolút tolása, ahonnan kezdve az exponenciális ido  A 3-SAT naiv” ≥ n0 méretu bemenetek mellett elviselhetetlenül nagyra no. ”n n  algoritmusának O(2 ) korlátját hozzávetoleg annyira le lehet szorítani, hogy egy O(c ) al-

futási ideje n

  alatt, ami goritmussal kétszeres méretu  bemenetek feldolgozása válik lehetové azonos ido  nagy gyakorlati jelentoséggel bír. Pontosan ez az eset áll fenn c



ahol az algoritmus O(

2

2n

)

=

n

=



2

≈ 1.4142

mellett,

 O(2 ) idoben dolgozik (lásd még a 159. oldalon a

4.10.

táblázatot).  A következokben bemutatunk egy algoritmust

3-SAT-hoz, amely a visszalépésen alapul.

Ez az algoritmusfejlesztési technika azon problémák megoldására alkalmas, ahol a meg tevodik   oldás n darab alkotóelembol össze, melyeknél több választási lehetoség adódik.

140

4. Bonyolultságelmélet

Például

3-SAT

 behelyettesítés, ami n darab igazságértékébol  egy megoldása egy kielégíto

 áll, továbbá minden ilyen igazságértékhez két választási lehetoség adódik:

 vagy ,

illetve 1 vagy 0. Az ötlet ezután abból áll, hogy az üres megoldásból (részleges behelyette lépésre, a Backtracking-eljárás sítés, ahol a változók nincsenek kitöltve) kiindulva lépésrol rekurzív hívásával a probléma mind nagyobb részleges megoldását hozzuk létre, amíg meg  rekurziós fában nem találjuk a teljes megoldást, már amennyiben az létezik. A keletkezo

4

a gyökeret megjelöljük az üres megoldással, a probléma teljes megoldásai pedig a levelek szintjére kerülnek. Ha az algoritmus végrehajtása során megállapítjuk, hogy a rekurziós fa aktuális ága

halott”, vagyis az addig konstruált részmegoldás semmi esetben sem egészít”  ki a probléma teljes megoldásává, akkor az eddig elért csúcs alatti részfát nyugodtan leheto  oleg  vághatjuk. A meghívandó eljárást visszaléptethetjük, próbálkozhatunk az eloz konstru-

ált részmegoldás újabb folytatásával. Ennek a visszalépésnek köszönheti nevét a visszalépés algoritmikai elve. A rekurziós fa

”

 tudunk megtakarítani. halott” részeinek levágásával idot

B-SAT(ϕ, β) 1

β-ban ϕ minden változója ki van töltve then return ϕ(β) elseif β hamissá teszi ϕ egy klózát

if

2 3 4

B Halott ág.

then return 0 elseif B-SAT(ϕ, β0)

5 6

then return 1 else return B-SAT(ϕ, β1)

7

A B-SAT algoritmus egy

ϕ Boole-formula bemenet és ϕ valamely változóβ parciális  hozzárendeléssé bovíthet   és 0-át megoldás egy minden változót tartalmazó ϕ-t kielégíto o, egyébként. A parciális hozzárendeléseket ebben az esetben a {0, 1} ábécé fölötti, n-nél nem  hívása a B-SAT(ϕ, λ), ahol hosszabb szavaknak tekintjük. Az algoritmus kezdo  λ az üres hozzárendelés. Látható, hogy ha az elozetesen konstruált β parciális hozzárendelés ϕ valamely klózát hamissá teszi, akkor az már soha nem lesz kiegészítve egy ϕ-t kielégíto β

inak

részleges hozzárendelése mellett egy Boole-értéket ad vissza: 1-et, ha a

hozzárendeléssé, a rekurziós fa aktuális csúcs alatti részfáját levágjuk (lásd még a 4.3-1. gyakorlatot).  becsléséhez az adott A B-SAT futási idejének felso  szolegesen választott C j klózt vizsgálunk. A

ϕ

minden

β

ϕ formulából egy tet-

 hozzárendelése – és kitöltendo

 most elsosorban   ebbol a három C j -ben eloforduló változó – igazságértékeket kell kapjon 3

értékül. A 0 vagy 1 sorozatok 2

=

  az algoritmus biztosan kiválasztja 8 lehetoségéb ol

azt az egyet, amely C j -t hamissá teszi. A szóban forgó csúcs B-SAT(ϕ, β) rehalott” részfához vezet, amit nyugodtan levághatunk. A ϕ for”  adódóan további halott” részfák állnak elo,  melyeket nem kell gyemula szerkezetébol ”  adódik a B-SAT egy felso  korlátjára legrosszabb esetben lembe venni, ebbol kurziós fájában tehát egy

3

O((2

4

− 1)n/3 ) = O(

√ 3

n

7 )

≈ O(1.9129n ), ami a

naiv” ”

3-SAT algoritmus O(2n ) korlátját még

A félreértések elkerülése végett hangsúlyozni kell, hogy a rekurziós fa más, mint egy NTM kiszámítási fája. A

B-SAT algoritmus teljesen determinisztikusan muködik,  egy rekurziós fa mélységi bejárásának meg  csúcsai az algoritmus rekurzív hívásait reprezentálják, a gyökere az elso  hívást, a feleloen. Egy ilyen fa belso ˆ csúcsa pontosan akkor gyeleveleknél pedig további hívások nélkül terminál az algoritmus. A rekurziós fa egy k ˆ hívás az algoritmus k után kiváltott számításán belül következik be, továbbá nincs olyan reke egy k csúcsnak, ha a k k

? hívás, ami k-n belül van és k? -on belül van.

141

4.3. Az ítéletlogika kielégíthetoség-problémája 

mindig javítja valamelyest. A

 3-SAT determinisztikus idobonyolultsága még lejjebb szorítható, például Monien és

 korláttal rendelkezik. A Speckenmeyer oszd-meg-és-uralkodj algoritmusa O(1.618 ) felso n

 korlát világrekordját determinisztikus felso

3-SAT-algoritmusra jelenleg egy O(1.481n ) kor-

látos, lokális keresésen alapuló megoldás tartja, melyet Dantsin és társai készítettek. Vannak más, nemdeterminisztikus megközelítések is. Ezek közül egyet mutatunk be, egy Schöning  úgynevezett munkáiból meríto,

véletlen séta” algoritmust. ”

4.3.2. 3-SAT valószín¶ségi id®bonyolultsága Egy véletlen séta egy (véletlen) bejárás adott struktúrán, például egy euklideszi térben, egy végtelen rácson vagy egy gráfon. Esetünkben a gráfok bejárása érdekes, azon belül is olyan gráfok bejárása, melyek egy meghatározott sztochasztikus automatát reprezentálnak. Egy sztochasztikus automata egy speciális véges automata.  állapotgráfjának segítségével. A véges automata Egy véges automata szemléltetheto

Σ

állapotait csúcsok, az állapotok közti átmeneteket irányított, egy

ábécé szimbólumaival

 címkézett élek jelölik. Egy csúcs a kitüntetett kezdoállapot  szerepet kapja, ennél kezdodik  az automata muködése,  és akkor fejezodik be, ha a teljes bemenet feldolgozásra került. Az automata minden lépésben pontosan egy bemeneti szimbólumot olvas. Az állapotgráf bizonyos csúcsait végállapotként jelöljük meg, és amennyiben egy végállapotot érünk el a feldolgozás végén, akkor az automata elfogadja a bemenetet. Véges automatákkal szavakat ismerhetünk fel. Egy

Σ∗ -beli

=

w

w1 w2

· · · wn

szót az

 automata pontosan akkor fogad el, ha a kezdoállapotból kiindulva w minden egyes wi szim sorrendben elolvassa, az állapotátmeneteket mindig a wi -vel jelölt él bólumát a megfelelo  követésének megfeleloen hajtja végre, és végül elér egy végállapotot. Egy véges automata által elfogadott nyelv pontosan az ilyen módon elfogadott szavakból áll. Egy

S

sztochasztikus automata éleit utólagosan számokkal is felcímkézzük. Az

 élhez rendelt pu,v (0 lapotgráfjában egy u-ból v-be vezeto színuségét  adja meg, hogy

S





pu,v

S

ál-

1) érték annak való-

az u állapotból v állapotba lép. Egy sztochasztikus automata

(véletlen) állapotátmeneteinek folyamatát a sztochasztika tárgykörében Markov-láncoknak,

S sztochasztikus autoS által elfogadott nyelv

a végállapotokat pedig abszorpciós állapotoknak nevezhetjük. Egy mata esetében így természetesen egy w szó elfogadása (és ezzel az

deniálása) csak adott valószínuséggel  következik be, mely valószínuséget  a w feldolgozása  ismerhetjük. során bejárt élek címkéibol Esetünkben azonban nem a nyelvfelismerés érdekes a sztochasztikus automata feladatai közül. Az automatát egy bejárásra szeretnénk alkalmazni, amit a R-SAT valószínu ségi algoritmus valósít meg. A R-SAT algoritmus megpróbál az n-változós

ϕ Boole-

 behelyettesítést találni, amennyiben létezik ilyen. formulához egy kielégíto R-SAT valamely

 ϕ bemenet mellett eloször is készít egy véletlenszeru  β kezdeti β minden egyes bitje függetlenül választott egyenletes eloszlás mellett, tehát β minden bitje 0 vagy 1 értéket vesz fel 1/2–1/2 valószínuséggel.  A behelyettesíté seket ismét mint {0, 1} feletti n-hosszú szavakat kezeljük. Tegyük fel, hogy ϕ kielégítheto, ˜ ϕ tetszolegesen   behelyettesítése ϕ-be. Legyen X az a valóés legyen β választott kielégíto ˜ Hamming-távolságát fejezi ki, vagyis azon bitek számát, színuségi  változó, ami a β és ⠘ nem egyeznek meg. X nyilvánvalóan a j ∈ {0, 1, . . . , n} értékeket veheti fel, valaahol β és β  mint X = j valószínusége  n binomiális eloszlású n és 1/2 paraméterekkel. Ennek megfeleloen hozzárendelést, ahol

−n

j

2

.

142

4. Bonyolultságelmélet

s 1

6

15

20

15

6

1

64

64

64

64

64

64

64

2

2

3

1

0

1

1

3

2

3

2 3

3

2 3

4

2 3

5

6

1

1

1

1

1

3

3

3

3

3

2 3

4.7. ábra. Egy R-SAT bejárás sztochasztikus automatájának állapotgráfja.

R-SAT(ϕ) 1

for i

← 1 to d(4/3)n e

2

do válasszunk egy

3

for j

4

B n a ϕ változóinak száma. β ∈ {0, 1}n behelyettesítést, egyenletes eloszlás szerint

← 1 to n ϕ ( β) = 1

do if

β

7

B β kielégíti ϕ-t. = (x ∨ y ∨ z) klózt, ahol C(β) = 0 válasszunk véletlenszeruen  egy ` ∈ { x, y, z} literált,

8

állapítsuk meg

9

változtassuk meg

5

then return

6

else válasszunk egy C

egyenletes eloszlás szerint

10

return

β `-edik lefoglalt β` ∈ {0, 1} bitjét β-ban β` -t (1 − β` )-re

ϕ kielégíthetetlen”

”

 A R-SAT algoritmus ezután ellenorzi, hogy a kezdetben választott

β hozzárenϕ formulát, és amennyiben igen, akkor elfogadja a bemenetet. Egyébként pedig ha β nem teszi igazzá ϕ-t, akkor léteznie kell egy ϕ-beli klóznak, amit β nem elégít ki.  A R-SAT tetszolegesen kiválaszt egy ilyen klózt, a kiválasztott klózban egyenletes eldelés kielégíti-e a

oszlás mellett véletlenszeruen  kijelöl egy literált, és megcseréli az ehhez a literálhoz rendelt

β behelyettesítésben. Ezt n-szer megismétli, majd amennyiben az aktuális ϕ formulát, akkor a R-SAT újraindul egy n új kezdeti hozzárendeléssel és megismétli a teljes fent leírt próbát t-szer, ahol t = d(4/3) e. A 4.7. ábrán egy S sztochasztikus automata szerepel, melynek éleit nem szimbólumokkal, hanem mindössze átmenet-valószínuségekkel  címkéztük. A R-SAT algoritmus ϕ  bemenet melletti muködését  a következokben mint S egy bejárását mutatjuk be. Az s kez  doállapotból kiindulva – amit késobb már sosem érintünk – R-SAT(ϕ) az n és 1/2  paraméteru  binomiális eloszlásnak megfeleloen lép tovább egy j ∈ {0, 1, . . . , n} állapotba.  része egy n = 6 változós ϕ Boole-formula esetében. Egy ilyen j álEzt mutatja a kép felso ˜ kielégíto  lapot azt jelenti, hogy a véletlenszeruen  választott β kezdeti behelyettesítés és a β behelyettesítés állandó közötti Hamming-távolság j. Amíg j , 0, addig R-SAT(ϕ) a  for ciklusban a kielégíto  megoldást keresve mindig megváltoztatja az aktuális β bebelso helyettesítés egy β` bitjét (1 − β` )-re. Az S bejárásban ez megfelel egy lépésnek a j − 1  állapotba balra vagy a j + 1 állapotba jobbra, ahol csak n-nél kisebb vagy n-nel egyenlo bitet az aktuális

behelyettesítés még mindig nem elégíti ki a

 el. állapot érheto ˜ behelyettesítés kielégíti Az állandóra választott β

ϕ-t, tehát ϕ minden klózából legalább ˜ által egy literált igazzá tesz. Ha minden klózban pontosan egyet kijelölünk ezek közül a β

143

4.3. Az ítéletlogika kielégíthetoség-problémája 

` literált − 1-be) nyilvánva j + 1-be) valószínusége lóan mindig 1/3, a jobbra lépés ( j-bol  pedig mindig 2/3. ˜ Hamming-távolsága 0 lesz. Ennek Bármikor is érjük el a j = 0 állapotot, ott β és β  megfeleloen β kielégíti a ϕ formulát, és R-SAT(ϕ) visszaadja β aktuális értékét, majd ˜ -tól kümegáll elfogadó állapotban. Egy j , 0 állapotban természetesen belefuthatunk egy β

kielégített literálok közül, úgy pontosan akkor lépünk egy lépést balra, ha ezt az R-SAT(ϕ) kiválasztja. Egy balra lépés valószínusége  (j

>

0-ból j

 kielégíto  behelyettesítésbe is, de mivel ez a lehetoség  lönbözo az elfogadás valószínuségét  csak növelheti, ezért az elfogadás valószínuségének  becslésénél most gyelmen kívül hagyjuk. Ha a j

= 0 állapotot nem érjük el β behelyettesítés n-szeri bitcseréjével, akkor a kezdo

behelyettesítést olyan rosszul választottuk, hogy R-SAT(ϕ) egyszeruen  eldobja, és egy új kezdeti értékkel próbál ismét szerencsét.  0 végállapottól jobbra távoMivel annak valószínusége,  hogy a (számunkra kedvezo) lodjunk nagyobb, mint annak valószínusége,  hogy 0 irányába balra haladjunk, azt gondolhatjuk, hogy R-SAT nem túl nagy valószínuséggel  jár sikerrel. Annak esélyét sem  rögtön a nulladik lépés után a 0 közelébe kerülünk. szabad azonban alábecsülni, hogy s-bol  pozíciónk, annál nagyobb annak valószínusége, Minél közelebbi a 0-hoz a kezdo  hogy a  véletlen jobbra- vagy balra-lépések lefutásával 0-ba ütközünk. rákövetkezo R-SAT eredményességének valószínuségére  és az algoritmus futási idejére vonatkozó elemzést itt most nem mutatjuk be teljes részletességében, csak vázlatszeruen.  Az egyszeruség  kedvéért tegyük fel, hogy n a 3 egész értéku  többszöröse. Legyen pi annak valószínusége,  hogy R-SAT n lépésen belül eléri a 0 állapotot, azzal a feltétellel, hogy R-SAT a bejárás nulladik lépésében (β kezdeti véletlen hozzárendelés megválasztásakor) az i

≤ n/3

állapotba kerül. Amennyiben például kezdetben az n/3 állapotba

kerülünk, akkor legfeljebb n/3 lépés megengedett a

rossz” irányba jobbra, ami kiegyen”  el helyes” irányba, balra tett lépésekkel. Egyéb esetekben a 0 állapot nem érheto ” n lépésben. Általában az i állapotból kiindulva legfeljebb (n − i)/2 lépést tehetünk jobbra,

 a lítheto

 a következo  becslés adódik pi -re: amibol

pi

=

n n−i 2

!

2

!(n−i)/2

3

1

!n−(n−i)/2

3

.

(4.2)

Legyen továbbá qi annak valószínusége,  hogy R-SAT a bejárás nulladik lépésében az i

≤ n/3 állapotba jut. Ekkor természetesen fennáll ! n qi = · 2−n .

(4.3)

i

 Végül pedig legyen p az eredményesség valószínusége,  amikor R-SAT a külso for ciklus egy körében eléri a 0 állapotot. Ez lehetséges j

> n/3 állapotokból is. Ennélfogva

fennáll

p



n/3 X

pi

· qi .

i=0

 az entrópiafüggvény segítségével, továbbá az összeg tagjaiban Ez az összeg közelítheto  a Stirling-formulával, így végül (4.2) és (4.3) binomiális együtthatói közelíthetok

Ω((3/4)n )

adódik p alsó korlátjának. A hibás futás elkerülése érdekében a R-SAT algoritmus összesen t független kí sérletet hajt végre, melyek mindegyike új kezdoértékkel indul, és legalább a fent megadott

144

4. Bonyolultságelmélet

(3/4)  hozzávetoleges

n

valószínuséggel  sikerrel jár. Mivel a kísérletek függetlensége miatt

ezek a valószínuségi  értékek szorzódnak, ezért R-SAT eredményes futásának valószínusége  – tehát annak valószínusége,  hogy R-SAT megadja

ϕ

 beheegy kielégíto

lyettesítését, amennyiben az létezik – nagyon közel van 1-hez. Ha pedig

ϕ kielégíthetetlen, ϕ kielé-

R-SAT sosem követ el hibát, tehát ezekben az esetekben a kimenet mindig gíthetetlen” lesz. Az algoritmus futási ideje megegyezik az eredményes futás p



(3/4)

n

”

valószínuségé

nek reciprokával, mivel egy hiba valószínusége  (amikor a t próba során egyszer sem találunk t −t · p  (1 − p) ≤ e  Amennyiben ϕ kielégítheto) -vel becsülheto.   t értékét tehát nem szeretnénk egy elore adott ε hibavalószínuségi  értéket átlépni, elegendo −t· p  ol  úgy megválasztani, hogy e ≤ ε illetve t ≥ ln(1/ε)/ p fennálljon. A konstans tényezokt n n  az algoritmus futási ideje tehát O ((4/3) ). eltekintve ez t = d(4/3) e választásával elérheto,

 behelyettesítést, pedig kielégíto

Gyakorlatok

4.3-1. Indítsuk el a B-SAT algoritmust

ϕ = (¬ x ∨ y ∨ ¬z) ∧ (x ∨ ¬y ∨ z) ∧ (¬u ∨ ϕ egy kielégíto

 lépésre y ∨ z) ∧ (u ∨ ¬y ∨ z) Boole-formulával, és konstruáljuk meg lépésrol

behelyettesítését. Rajzoljuk fel az így kialakuló rekurziós fát, és határozzuk meg a fa azon részeit, melyeket levágunk, mert nem vezethetnek megoldáshoz.

4.4. Gráfizomorfizmus és alsóság  alfejezetben szükségünk lesz a 3.1.3. alfejezetben leírt csoport- és gráfelméA következo leti alapokra. Különösen fontos felidézni a 3.6. deníció permutációcsoport fogalmát, a grázomorzmus problémát, valamint a 3.8. deníció

GA

GI

gráfautomorzmus problémáját

(lásd még a 3.4. példát is).

4.4.1. Visszavezethet®ségek és bonyolultsági hierarchiák A 4.2. pontban megismerkedtünk a hatékonyan megoldható házasítás problémával, valamint az NP-teljes

SAT, 3-SAT és 3-DM problémákkal. Könnyen meggondolhatjuk, hogy P =

NP

pontosan akkor teljesül, ha minden NP-beli probléma – beleértve az NP-teljes problémákat is – P-ben helyezkedik el. Amennyiben P

, NP, akkor P-ben nem lehetnek NP-teljes prob, NP

  P lémák. Megoldható-e vajon hatékonyan minden NP-beli probléma a hihetonek tun  o

feltevés mellett, tehát P-beliek-e, vagy pedig NP-teljesek? Tudunk-e vajon olyan NP-beli problémákat adni P

,

NP feltevés mellett, melyek nem oldhatók meg hatékonyan, de nem

 tétel adja meg. is NP-teljesek? A választ a következo 4.11. tétel (Ladner). Ha P

,

NP, akkor léteznek olyan problémák NP-ben, melyek se nem

P-beliek, se nem NP-teljesek. A Ladner által megadott problémák valamelyest mesterségesek” olyan szempontból, ” hogy közvetlenül a 4.11. tétel bizonyításához készültek. Vannak azonban olyan természe jelöltek arra, hogy se P-beliek, se pedig NPtes problémák is NP-ben, melyek megfelelo teljesek ne legyenek. Ezek közül egy

GI,

a grázomorzmus probléma, és ezt szeretnénk

most bizonyítani. Ehhez deniálunk NP-n belül két, Schöning által bevezetett bonyolultsági osztályhierarchiát, az úgynevezett alsó-, valamint a felso-hierarchiát.  Ahhoz, hogy

145

4.4. Grázomorzmus és alsóság

 polinomiális idoezt a két hierarchiát deniálni tudjuk, be kell vezetnünk az NP-re épülo  hierarchia fogalmát, ennek deníciójához pedig szükségünk van egy, a 4.5. denícióban   bevezetett sok-egy visszavezethetoségnél általánosabb visszavezethetoségre, nevezetesen a p

≤T fogalmára. Deniáljuk továbbá a nemdeterminisztikus és az NP NP – fogalmakat, melyek a és ≤ erosen  nemdeterminisztikus Turing-visszavezethetoség  –≤ sT T

Turing-visszavezethetoség,  a

  polinomiális ido-hierarchia esetében fontosak. Ezek a visszavezethetoségek az orákulumos Turing-gép fogalmára építkeznek. Most tehát deniáljuk a nevezett fogalmakat. 4.12. deníció (orákulumos Turing-gép). Az orákulum-halmaz (röviden orákulum) szavak egy halmaza. Egy B orákulummal rendelkezo  orákulumos M Turing-gép egy olyan Turing-gép, ami rendelkezik egy speciális

kérdés-szalaggal, állapotainak halmaza pedig

tartalmaz egy speciális z? kérdés-állapotot, valamint zyes és zno válasz-állapotokat. Amíg M nincs a z? állapotban, addig pontosan úgy viselkedik, mint egy szokványos Turing-gép. Ha azonban muködése  során z? kérdés-állapotba kerül, akkor megszakítja futását, és kérdést intéz az orákulumhoz az éppen a kérdés-szalagon álló q szóról. Az orákulumot egyfajta fekete dobozként” képzelhetjük el: B orákulum egy lépésben eldönti, hogy q szó B-beli-e, ” függetlenül attól, hogy ennek eldöntése milyen nehézségu  feladat. Ha q ∈ B, akkor M a következo  lépésben zyes válasz-állapotba kerül és folytatja muködését.  Ellenkezo  esetben (ha q

<

B) M zno állapotban folytatja muködését.  Ekkor azt mondjuk, hogy az M Turing-géppel B

x bemenet kiszámítása relatív B orákulumra nézve, a kiszámítást pedig M (x)-el jelölünk. B

Legyen L(M ) az M

B

által elfogadott nyelv. Egy

C bonyolultsági osztályt relativizálhatónak

nevezünk, ha reprezentálható orákulumos Turing-gépekkel (üres orákulum-halmaz mellett) az eloz  oeknek  megfeleloen.  Deniáljuk egy orákulum mellett a B-re relatív

C

C relativizálható bonyolultság-osztály és egy

B

osztályt a következoképp: 

CB = {L(M B ) | M egy C-t reprezentáló orákulumos Turing-gép} . S B B Ha B halmazok egy osztálya, akkor legyen C = B∈B C . NPOTM (illetve DPOTM) jelöli a nemdeterminisztikus (illetve a determinisztikus) po osztályok: linomiális ideju  orákulumos Turing-gépeket. Deniálhatók például a következo NP

NP

=

P

NP

=

[ NP

B

= {L(M B ) | M egy NPOTM, B pedig NP-beli} ;

B∈NP

[

P

B

= {L(M B ) | M egy DPOTM, B pedig NP-beli} .

B∈NP

Amennyiben az orákulum üres halmaz (∅), akkor a nem relativizálható NP P

=

P



=

NP



illetve

 beszélhetünk, DPOTM heosztályokhoz jutunk. NPOTM helyett ekkor NPTM-rol

 Különösen jól alkalmazhatók az orákulumos Turing-gépek keresési lyett pedig DPTM-rol.  példa mutatja. Az itt alfeladatokhoz, mint amilyen a prexkeresés is, ahogy a következo kalmazott Pre-Iso NP-orákulum szolgáltatja azt az információt, hogy hogyan lehet az üres  bitre haladva az NP-beli szóból kiindulva bitrol

 GI probléma legkisebb megoldását eloállí-

tani, amennyiben létezik ilyen megoldás. 4.5. példa. Prexkeresés a legkisebb izomorzmus után orákulumos Turing-géppel. A

GI

grázomorzmus problémát az 3.1.3. alfejezet 3.8. deníciójában fogalmaztuk meg. Le-

gyenek G és H két adott gráf n

≥ 1 darab csúccsal. A G és H

közti izomorzmusokat

(G , H) ”

∈ GI”

146

4. Bonyolultságelmélet

megoldásának

nevezzük. Az Iso(G , H) izomorzmus-csoport tartalmazza a

megoldását, valamint Iso(G , H)

, ∅ ⇐⇒

 legkisebb megoldás eloállítása a célunk, vel tudatnunk kell, hogy függvényt:

”

(G , H)

< GI”. (

f (G , H)

=

(G , H) ∈ GI” összes ” ∈ GI. Ha (G, H) ∈ GI, akkor egy lexikograkusan  esetben pedig az üres λ szó kimenet segítségéellenkezo (G , H)

 Tehát, ki szeretnénk számítani a következoképp deniált f

π ∈ Iso(G, H)},

min{π

ha (G , H)

λ,

ha (G , H)

Sn deníciója a kö= {1, 2, . . . , n} ábécé fölötti π(1)π(2) · · · π(n) szót. Pontosan akkor írható π < σ (π, σ ∈ Sn ), ha létezik egy olyan j ∈ [n], melyre minden i < j esetén π(i) = σ(i), valamint π( j) < σ( j). Amennyiben egy σ ∈ Sn permutációból kitörlünk néhány (i, σ(i)) párt, akkor parciális permutációt kapunk, amit szintén kezelhetünk [n] fölötti szóként. A σ ∈ Sn egy k ≤ n hosszú prexe σ egy olyan parciális permutációja, amely minden (i, σ(i)) párt tartalmaz i ≤ k mellett, viszont egyetlen (i, σ(i)) párt sem i > k esetén. A k = 0 esetben σ prexe a λ üres szó, valamint k = n esetben a teljes permutáció. Ha π a σ ∈ Sn egy k < n hosszú prexe és w = i1 i2 · · · i|w| egy [n] fölötti |w| ≤ n − k hosszú szó, akkor jelölje πw azt a parciális permutációt, ami  π-t a (k + 1, i1 ), (k + 2, i2 ), . . . , (k + |w|, i|w| ) párokra bovíti. Ha 1 ≤ j ≤ |w| esetén σ(k + j) = i j , akkor πw is σ egy prexe. Deniáljuk G és H gráfok mellett az Iso(G, H)-beli izomorzmusok prexeinek

ahol a lexikograkus rendezésre vonatkozó minimumot

π ∈ Sn

 kezeljük a vetkezo:

 Sn -bol

∈ GI , < GI ,

képezzük. A

egy permutációját mint n hosszú, [n]

halmazát:

{(G, H, π) (∃w ∈ {1, 2, . . . , n}∗ ) [w = i1 i2 · · · in−|π|

=

Pre-Iso

és

πw ∈ Iso(G, H)]} .

≥ 1-re a λ üres szót egy permutáció sem képzi le Sn -be, valamint hogy = ∅ pontosan akkor áll fenn, ha (G, H, λ) < Pre-Iso, ami viszont akkor és csak akkor igaz, ha (G , H) < GI. Figyeljük meg, hogy n Iso(G , H)

N-P-I(G , H) if (G , H, λ)

1

< Pre-Iso

2

then return 0

3

else

4

π←λ j ← 0

5

while j

6

m. Egy h : Σt → Σm hasító függvény lineáris leképezés, ami egy (t × m) Boole-mátrixszal t adott, mégpedig Bh = (bi, j )i, j -vel, ahol bi, j ∈ {0, 1}. Minden x ∈ Σ és 1 ≤ j ≤ m mellett az m y = h(x) ∈ Σ j-edik bitje mint y j = (b1, j ∧ x1 ) ⊕ (b2, j ∧ x2 ) ⊕ · · · ⊕ (bt, j ∧ xt ) adódik, ahol ⊕ a logikai paritásmuveletet  jelenti, tehát a1 ⊕ a2 ⊕ · · · ⊕ an = 1 ⇐⇒ |{i | ai = 1}| ≡ 1 mod 2. t m Legyen Ht,m = {h : Σ → Σ | Bh egy (t × m) Boole-mátrix} hasító függvények egy családja, t és m paraméterekkel. A Ht,m -re egyenletes eloszlást tételezünk fel: Ht,m -bol  egy 4.19. deníció (hasítás). t

h hasító függvényt emelünk ki, amelynél a Bh -beli bi, j -ket függetlenül és egyenletes eloszlás mellett választjuk. Legyen V

⊆ Σt . A Ht,m (∃v

Egyéb esetekben

egy

b részcsaládjára akkor lép fel ütközés V -n, ha H

b) (∃ x ∈ V ) [v , x ∧ h(v) = h(x)] . ∈ V ) (∀h ∈ H

b a V -n ütközésmentes. H

 Egy V fölötti ütközés azt jelenti tehát, hogy megsérül egy tetszolegesen választott

b H

 lemma kimondja, hogy minden családbeli hasító függvény injektivitása V -n. A következo  kelloen kis V halmazon

Ht,m

egy véletlenszeruen  választott részcsaládja ütközésmentes, ha

pedig V túl nagy, az ütközés elkerülhetetlen. A 4.20. lemma bizonyításától eltekintünk. 4.20. lemma (hasítás lemma).

Legyenek t, m

∈ N

paraméterek, V

⊆ Σt

és

b = H

(h1 , h2 , . . . , hm+1 ) egy egyenletes eloszlás mellett véletlenül választott hasító függvény család

Ht,m -bol.  Legyen K(V )

b | (∃v ∈ V ) (∀h ∈ H b) (∃ x ∈ V ) [v , x ∧ h(v) = h(x)]} = {H

b-ban egy ütközés fellépésének eseménye V -n. Ekkor H 1.

ha |V |

≤ 2m−1 , akkor K(V ) legfeljebb 1/4 valószínuséggel  következik be,

2.

ha |V |

> (m + 1)2m , akkor K(V ) 1 valószínuséggel  következik be.

A 3.5. alfejezetben deniáltuk az Artúr-Merlin hierarchiát és említettük, hogy ez a hierarchia a második szintjére omlik össze. Számunkra most a coAM osztály érdekes, lásd a 3.16. deníciót.

152

4. Bonyolultságelmélet

GI probléma Low2 -beli.

4.21. tétel (Schöning). A

Bizonyítás. A 4.18. tétel alapján minden coAM-beli NP-halmaz Low2 -beli. beliségének belátásához elégséges tehát azt megmutatni, hogy

GI

GI

Low2 -

coAM-beli. Legyenek

 gráfok. A hasítás lemmát szeretnénk alkalmazni. Ígéretesnek G és H n csúccsal rendelkezo tunik,  hogy a 3.11. lemmában deniált A(G , H)

= {(F, ϕ) | F  G és ϕ ∈ Aut(F)} ∪ {(F, ϕ) | F 

H és

ϕ ∈ Aut(F)}

halmaz a 4.20. lemma V -jének szerepét vegye fel. A 3.11 lemma szerint | A(G , H)| amennyiben G



H és | A(G , H)|

= 2n!, ha G 

H. Ahhoz, hogy a

= n! GI-t megoldó coAM-gép

 polinomiális idoben dolgozzon, a hasítás lemma t és m paraméterei n-ed fokú polinomok kell legyenek. A lemma alkalmazásához az m hogy n! fennálljon, mivel ekkor lesz a V

= m(n) polinomot úgy kellene választanunk,

≤ 2m−1 < (m + 1)2m < 2n!

=

(4.4)

 A(G , H) halmaz elég nagy ahhoz, hogy elegendoen nagy

valószínuséggel  meg tudjunk különböztetni két izomorf G és H gráfot két nem izomorf gráf tól. Sajnos nem létezik olyan m polinom, hogy a (4.4) egyenlotlenség fennálljon, ehelyett  és alsó korlátok közötti rést elég naggyá választunk egy másik V halmazt, amivel a felso tudjuk tenni. Legyen V

=

A(G , H)

n

=

A(G , H)

|

 × A(G, H) × · · · × A(G, H). Ezzel (4.4) a következo{z } n-szer

képp alakul: n

(n!)

≤ 2m−1 < (m + 1)2m < (2n!)n ,

(4.5)

= m(n) = 1 + dn log n!e választással.  GI-hez a következoképp. Az n csúcsú G és H gráfok n  kiszámítja az m paramétert. A V = A(G , H) halmaz bemenete mellett M mindenekelott n darab (F, ϕ) formájú párost tartalmaz, ahol F egy n csúcsú gráf és ϕ ∈ Aut(F). Tekintsük a V elemeit mint t(n) hosszú, Σ = {0, 1} ábécé fölötti szavakat, ahol t egy alkalma  az m ahol az új egyenlotlenség kielégítheto Készítsünk egy M coAM-gépet

san választott polinom. Ekkor M egyenletes eloszlás mellett véletlenszeruen  választ egy

b = H

(h1 , h2 , . . . , hm+1 ) hasító függvény családot

 Ht,m -bol,

ami megfelel Artúr lépésének.

b hasító függvényt egy (t × m) Boole-mátrixszal reprezentálunk, ezért az ∈ H ∗ b m + 1 darab, H -beli hi hasító függvény ábrázolható mint p(n) hosszú z b ∈ Σ szó, ahol p

Minden hi

H

egy alkalmas polinom. Módosítva a hasítás lemma K(V ) ütközés predikátumát B

= {(G, H, zHb ) | (∃v ∈ V ) (∀i : 1 ≤ i ≤ m + 1) (∃ x ∈ V ) [v , x ∧ hi (v) = hi (x)]} .

A B-ben elforduló

∀ kvantor csak

polinomiálisan sok i-t határoz meg, ezért determiniszti-

  valamint B mindkét kus módon polinomiális idoben kiértékelheto, egy darab polinomiális hosszra korlátozott

Σ1p =



∃ kvantora összefogható

kvantorrá. A 4.16. tétel alapján tehát B egy

 szóhoz – amit m NP-beli halmaz. Legyen N egy NPTM B-hez. A z b készülo

H

+1

függetlenül és egyenletes eloszlás mellett választott hasító függvény reprezentál – M szimulálja az N(G , H, z b ) kiszámítását, ami megfelel Merlin lépésének. Az M pontosan akkor

H

fogadja el a (G , H) bemenetét, ha N(G , H, z b ) elfogad.

H

Becsüljük meg (a z b -ban kódolt hasító függvény véletlenszeru  választása mellett) anH nak valószínuségét,  hogy M elfogadja (G , H) bemenetét. Ha G és H izomorfak, akkor a 3.11

153

4.4. Grázomorzmus és alsóság

lemma alapján | A(G , H)|

=

  |V | n!. A (4.5) egyenlotlenségb ol

=

(n!)

n



m−1

2

következik. A

4.20. lemma alapján annak valószínusége,  hogy (G , H, z b ) B-beli, következésképp M(G , H)

H

elfogad, legfeljebb 1/4. Ha ezzel szemben G és H nem izomorfak, akkor a 3.11. lemma szerint | A(G , H)|

=

2n!, a

  pedig |V | (4.5) egyenlotlenségb ol

=

n

(2n!)

>

(m

+ 1)2m

adódik.

A 4.20. lemma alapján ekkor annak valószínusége,  hogy (G , H, z b ) B-beli, tehát M(G , H)

H

 következik tehát, hogy elfogad, közel 1. Ebbol

GI coAM-beli.

4.4.3. A gráfizomorfizmus SPP-beli A 3.3.1. alfejezet 3.14. deníciójában bevezettük az RP valószínuségi  osztályt. A követ alfejezetben két további, itt deniált valószínuségi kezo  osztály játszik szerepet: pp és SPP, melyek a Probabilistic Polynomialtime és a Stoic Probabilistic Polynomialtime angol kifejezések rövidítései. 4.22. deníció (PP és SPP). A pp osztály azokat az A problémákat foglalja magában, melyekhez létezik egy M NPTM úgy, hogy minden x bemenetre: ha x nem kisebb valószínuség  mellett elfogad, és ha x

<



A, akkor M(x) 1/2-nél

A, akkor M(x) valamely 1/2-nél kisebb

valószínuséggel  fogad el. Jelölje acc M (x) az M(x) elfogadó útjainak számát egy M NPTM-nél x bemenet mellett, valamint rej M (x) az M(x) visszautasító útjainak számát. Legyen továbbá gap M (x) acc M (x)

=

− rej M (x).

Az SPP osztály azokból az A problémákból áll, melyekre létezik olyan M NPTM, hogy minden x-re (x



A

=⇒

gap M (x)

= 1) és (x <

A

=⇒

gap M (x)

= 0) teljesül.

Egy SPP-gép sztoikus” tehát abban az értelemben, hogy a rése” – tehát az elfogadó és ” ” a visszautasító utak különbsége – mindig csak két értéket vesz fel az exponenciális számú lehetséges érték közül. A pp-vel ellentétben az SPP így egy úgynevezett ígéret osztály ( promise class”), mivel egy M SPP-gép azt ígéri”, hogy minden x-re gap M (x) ” ” teljesül (lásd még a 4.4-4. gyakorlatot).

∈ {0, 1}

C bonyolultsági osztályra deniálhatC-alsó, ha CA = C teljesül. Speciálisan minden k-ra

 Az alsóság fogalmát tetszoleges relativizálható juk: egy A halmaz akkor és csak akkor

a 4.17. deníció alsóság-hierarchiájának Lowk szintje pontosan azokból az NP-halmazokból áll, melyek

Σkp -alsó tulajdonságúak. Minden, a fent deniált SPP osztályba tartozó halmaz

 tételben ezek mellett bizonyítás nélkül összefoglalunk néhány hasonló pp-alsó. A következo tulajdonságot. 4.23. tétel. SPP

1.

Az SPP osztály pp-alsó, tehát pp

2.

Az SPP önmagával alsó (angolul

3.

Legyen A



= pp.

self-low”), tehát SPP = SPP. ” A NP egy N NPTM-el egyeztetve és L ∈ SPP egy M NPOTM-mal egyeztetve SPP

úgy, hogy az M-A(x) minden x bemenetre csak olyan q kérdést tesz fel, melyre accN (q)



1 fennáll. Ekkor L SPP-beli. 4.

Legyen A



NP egy N NPTM-mel egyeztetve és f



FP

A

egy M DPOTM-ma egyez-

tetve úgy, hogy M-A(x) minden x bemenet mellett csak olyan q kérdést tesz fel, melyre accN (q)

≤ 1. Ekkor

f FP

SPP

-beli.

154

4. Bonyolultságelmélet

 tétel kimondja, hogy egy jobb oldali co-halmaz lexikograkusan legkisebb A következo permutációja hatékonyan kiszámítható. A

Sn

lexikograkus rendezését a 4.5. példában de-

niáljuk. 4.24. tétel. Legyen

G ≤ Sn

egy permutációcsoport

G = hGi mellett és π ∈ Sn

egy permu-

táció. Ekkor létezik olyan algoritmus, amely a (G , π) bemenetre polinomiális idoben  meghatározza a

Sn -beli G jobb oldali co-halmazát, Gπ-t.

Bizonyítás. A LERC algoritmus a lexikograkusan legkisebb permutáció kiszámítását végzi a

Sn -beli G

jobb oldali co-halmazában

Gπ-ben,

ahol a

G

permutációcsoport egy G

generátorfüggvényen keresztül adott, lásd a 3.1.3. pont 3.6. denícióját.  A 3.7. tétel segítségével polinomiális idoben számítható az id

G

= G(n) ≤ G(n−1) ≤ · · · ≤

≤ G = G, G stabilizátor lánc. Pontosabban fogalmazva minden egyes i-re meghatá képezzük G egy G(i) jobb oldali T i reprezentáns rendszerét, ahol 1 ≤ i ≤ n, és ebbol Sn−1 (n−1) (n)  T generátorát. Mivel ϕ = π és G = G = id, ezért a bizonyításerosebb S = i 0 i=1 hoz elég a LERC algoritmus helyességét megmutatni, tehát azt, hogy 0 ≤ i ≤ n − 1 esetén (i+1) minden i-re a G ϕi+1 -beli G(i) ϕi legkisebb permutációját kapjuk. (1)

(0)

rozzuk

LERC(G , π) 1 2 3 4 5 6 7 8

G-beli stabilizátorok G(n) ≤ G(n−1) ≤ · · · ≤ G(1) ≤ G(0) láncát ϕ0 ← π for i ← 0 to n − 1 do x ← i + 1 (i) számítsuk ki a G (x) pályán az y elemet, melyre ϕi (y) minimális (i) határozzunk meg egy τi permutációt G -ben τi (x) = y mellett ϕi+1 ← τi ϕi return ϕn

számítsuk ki a

 indukcióval következik, hogy Ebbol

G(n) ϕn = {ϕn }

a

Gπ = G(0) ϕ0

lexikograkusan legki-

sebb permutációja. Következésképp tehát a LERC algoritmus valóban legkisebb

Gπ lexikograkusan

ϕn permutációját adja vissza.

H ≤ Sn permutációcsoportbeli x ∈ [n] eleG(i) -beli permutáció, amely a i + 1-et a G(i) (i + 1) (i)  y-ra képzi le, és amelyre ϕi (y) = x a {ϕi (z) | z ∈ G (i + 1)} halmaz minimális pályában lévo (i)  eleme. A 3.7. tétel alapján a G (i + 1) pálya polinomiális idoben kiszámítható, és mivel G(i) (i + 1) legfeljebb n − i elemet tartalmaz, ezért y hatékonyan meghatározható. Az algorit(i) mus deníciója alapján fennáll ϕi+1 = τi ϕi . Mivel G minden permutációja minden [i]-beli (i) elemet önmagára képez le és mivel τi ∈ G , ezért minden j-re, amelyre 1 ≤ j ≤ i, minden τ ∈ G(i) -re és minden σ ∈ G(i+1) -re: A fenti állítás bizonyításához jelöljük egy

mek pályáját

H(x)-el.

Legyen

(σϕi+1 )( j)

τi

az a

= ϕi+1 ( j) = (τi ϕi )( j) = ϕi ( j) = (τϕi )( j).

 speciálisan következik, hogy minden Ebbol mutációra fennáll, hogy minden

G

(i+1)

G(i) ϕi -beli µ

lexikograkusan legkisebb per-

ϕi+1 -beli permutációnak egyeznie kell µ-vel az elso i

155

4.4. Grázomorzmus és alsóság

elemre. Ezen kívül minden

σ ∈ G(i+1) -re és a fent deniált

(σϕi+1 )(i

x

= ϕi (y) elemre fennáll

+ 1) = ϕi+1 (i + 1) = (τi ϕi )(i + 1) = x.

 G(i+1) ϕi+1 = {ϕ ∈ G(i) ϕi | ϕ(i + 1) = x}. Az állítás ezután abból a ténybol (i) következik, hogy a G ϕi -beli lexikograkusan legkisebb µ permutációra fennáll µ(i + 1) = Természetesen x.

Ezzel megmutattuk, hogy a LERC algoritmus hatékonyan és helyesen muködik. 

  a 4.25. következménnyé (lásd a 4-3.. feladatot). Ehhez A 4.24. tétel könnyen kibovíthet o  tételét, a 4.26. tételt. kapcsolódóan bebizonyítjuk az alfejezet fo

G ≤ Sn egy permutációcsoport ahol G = hGi, valamint leπ és ψ két permutáció Sn -ben. Ekkor létezik olyan algoritmus, amely (G, π, ψ) bemenet mellett polinomiális idoben  meghatározza ψGπ lexikograkusan legkisebb permutációját.

4.25. következmény. Legyen gyen

4.26. tétel (Arvind és Kurur). A Bizonyítás. Az

AUTO

GI probléma SPP-beli.

 probléma a következoképp deniált: számítsuk ki egy adott G gráf-

hoz az Aut(G) automorzmus-csoportot (a fogalmak értelmezéséhez lásd a 3.6 deníciót és  bekezdést, valamint a 3.8 deníciót). Mathon eredményei alapján alapján az az azt követo

AUTO és a GI problémák Turing-ekvivalensek, tehát AUTO ∈ FPGI és GI ∈ PAUTO , ezért elég AUTO FPSPP -beliségét megmutatni. Ezután SPP 4.23. tételbeli önmagával alsó ( self-low”) ” AUTO tulajdonságából következik, hogy GI P ⊆ SPPSPP ⊆ SPP-beli, amivel a tételt be is láttuk. SPP Célunk tehát, hogy találjunk AUTO-hoz egy FP -algoritmust. Ennek az algoritmusnak Sn−1  egy adott G gráf esetén egy S = T er os generátort kell kiszámítania Aut(G)-hez, ahol i i=1 id

= Aut(G)(n) ≤ Aut(G)(n−1) ≤ · · · ≤ Aut(G)(1) ≤ Aut(G)(0) = Aut(G)

az Aut(G) stabilizátorainak lánca, T i (1 reprezentáns rendszere Aut(G)

(i−1)



i



-ben. A triviális Aut(G) (i)

 generátort Aut(G) lépésre építünk fel egy eros  generátort Aut(G) egy eros

Sn−1 j=i

FP

(0)

=

(0)

-algoritmus Aut(G)

(i)

(n)

=

(i)

egy teljes jobb oldali

 id esettel kezdve lépésrol

 i mellett, végül tehát kapunk -hez, csökkeno

Aut(G)-hez. Tegyük fel tehát, hogy már találtunk egy S i

 generátort Aut(G) T j eros

SPP

n) pedig Aut(G)

=

=

Aut(G)-hez. Most leírjuk hogyan határozza meg az

egy teljes jobb oldali reprezentáns rendszerét Aut(G)

(i−1)

-ben,

T i−1 -et. Ehhez deniáljuk az

        A = (G , S , i, j, π)      

⊆ Aut(G) és hS i egy pontonkénti stabilizátora [i]-nek Aut(G)-ben, π egy pontonként [i − 1] által stabilizált parciális permutáció és π(i) = j, valamint létezik egy  τ ∈ Aut(G)(i−1) , ahol τ(i) = j és LERC(S , τ) a π bovítése S

              

halmazt. A 4.24. tétel alapján a hS iτ jobb oldali co-halmazhoz tartozó LERC(S , τ) lexiko grakusan legkisebb permutáció polinomiális idoben kiszámítható a LERC algoritmus se-

π parciális permutáció a (G, S , i, j, π) bemenet része, mivel az A halmazt mint τ ∈ Aut(G)(i−1) , τ(i) = j melletti permutáció prexkereséses meghatározásakor (vessük ezt össze a 4.5. példa N-P-I

gítségével. A

orákulumot szeretnénk használni a lexikograkusan legkisebb

156

4. Bonyolultságelmélet

algoritmusával).  hogy ha Az N algoritmus egy NPTM A orákulumhoz, tehát A NP-beli. Eldöntendo,

τ(i) =

j, akkor fennáll-e hS iτ jobb oldali co-halmaz minden

σ permutációjára σ(i) =

j.

N(G , S , i, j, π)

⊆ Aut(G)(i)

1

 ellenorizzük, hogy S

2

találjunk ki nemdeterminisztikusan egy

3

if

τ ∈ Aut(G)(i−1)

és

τ(i) =

j és

4

then elfogadás és megállás

5

else elutasítás és megállás

τ ∈ Sn permutációt B G n csúcsú.  τ a π bovítése és τ = LERC(S , τ)

Most megmutatjuk, hogy N elfogadó útjainak száma (G , S , i, j, π) bemenet mellett vagy 0 vagy 1, amennyiben hS i

= Aut(G)(i) , valamint általában fennáll

accN (G , S , i, j, π)



n

0, |Aut(G)

(i)

o |/|hS i| .

 Eloször egy pszeudokódot adunk meg. M-A(G) 1 2 3 4 5 6 7 8 9 10 11 12

← {} minden i-re, ahol 0 ≤ i ≤ n − 2 B G n csúcsú. B T i az Aut(G)(i+1) egy teljes jobb oldali reprezentáns rendszere lesz Aut(G)(i) -ben. S i ← ∅ minden i-re, ahol 0 ≤ i ≤ n − 2 (i)  generátor lesz Aut(G) -hez. S n−1 ← {id} B S i egy eros for i ← n − 1 downto 1 do B Az i-edik iteráció kezdetén S i -t már megtaláltuk, most S i−1 -et számítjuk ki. legyen π : [i − 1] → [n] parciális permutáció π(a) = a-val minden a ∈ [i − 1]-re B i = 1 esetén π a deniálatlan parciális permutáció. for j ← i + 1 to n  do π ˆ ← πj B Tehát πˆ bovíti π-t az (i, j) párral πˆ (i) = j mellett. if (G , S i , i, j, π ˆ) ∈ A (i−1)  then B A prexkeresés eloállítja a legkisebb Aut(G) -beli, Ti

 j-re képezo  permutációt. i-rol 13

for k

14

← i + 1 to n

do keressük meg az (G , S i , i, j, π` ˆ )

16 17

B T i−1

most az Aut(G)

rendszere Aut(G) 19 20

` elemet, πˆ leképezésein kívül, A mellett

πˆ ← π` ˆ B πˆ most egy teljes Sn -beli permutáció. T i−1 ← T i−1 ∪ π ˆ

15

18



S i− 1 return S 0

(i)

(i−1)

egy teljes jobb oldali reprezentáns -ben.

← S i ∪ T i−1 (0)  generátor Aut(G) = Aut(G) -hoz. B S 0 egy eros

157

4.4. Grázomorzmus és alsóság

Tegyük fel, hogy (G , S , i, j, π) A-beli. Ha

τ(i) =

j egy

τ∈

Aut(G)

akkor az hS iτ jobb oldali co-halmaz pontosan azokból az Aut(G)

(i−1)

(i−1)

mellett és j

>

i,

-beli permutációkból

áll, melyek i-t j-re képezik le. Következésképp N(G , S , i, j, π) egyetlen elfogadó útja megfelel az egyértelmuen  meghatározott lexikograkusan legkisebb nak. Ha viszont hS i az Aut(G)

(i)

τ = LERC(S , τ) permutáció(i) τ ábrázolható az hS i

egy valódi alcsoportja, akkor Aut(G)

= |Aut(G)(i) |/|hS i| darab diszjunkt jobb oldali co-halmazának egyesítéseként. Általában tehát N(G , S , i, j, π) akkor rendelkezik k elfogadó úttal, ha (G , S , i, j, π) A-beli, egyébként k

pedig nincs elfogadó útja. A

Az M-A egy FP -algoritmus

AUTO

képp minden valóban feltett q kérdésre fennáll accN (q)  ebbol

AUTO ∈ FPSPP

= = Aut(G)(i) , következés-

megoldásához. Itt az M DPOTM csak olyan q

(G , S i , i, j, π) kérdéseket tesz fel az A orákulumnak, melyekre hS i i



1. A 4.23. tétel 4. része alapján

következik.

= Aut(G)(0) -hoz – n szerinti teljes indukcióval mutatjuk meg. Az indukció kezdete az n − 1, S n−1 = {id} pedig (n−1)  Az indukciós lépéshez feltesszük, hogy az i-edik természetesen Aut(G) = id-t állítja elo.  generátor Aut(G) Az állítást – miszerint M-A(G) S 0 kimenete egy eros

(i)

 generátor Aut(G) iteráció kezdetekor már rendelkezésre áll egy S i eros hogy az i-edik iteráció végére az S i−1

=

Si

+1 ≤ j ≤ na ”  -ben létezik-e olyan permutáció, amely i-t j-re képezi le. A rákövetkezo

hez. Minden j-hez, ahol i (i−1)

hogy Aut(G)

-hez. Megmutatjuk,

(i−1)  generátor Aut(G) ∪ T i−1 halmaz egy eros (G , S i , i, j, π ˆ ) ∈ A?” kérdéssel megvizsgáljuk,

 kérdésekkel eloállítja  perxkeresés az A orákulumhoz intézett megfelelo a lexikograkusan (i−1)

legkisebb π ˆ permutációt Aut(G)

-ben π ˆ (i) = j mellett. Mint fent megállapítottuk ekkor  generátor ≤ 1-nek megfelelo q kérdéseket intézünk, mivel S i egy eros (i) (i)  Aut(G) -hez, tehát hS i i = Aut(G) . A permutáció eloállítása után az i-edik iteráció végén (i) (i−1) T i−1 Aut(G) egy teljes jobb oldali átlója Aut(G) -ben, következésképp S i−1 = S i ∪ T i−1 A-hoz csak accN (q)

 generátor Aut(G) egy eros Aut(G)

= Aut(G)

(0)

(i−1)

 generátort -hez. Végül n iteráció után megtalálunk egy S 0 eros

-hoz.

 két állításából közvetlenül adódik a 4.27. következmény. A 4.23. tétel elso

4.27. következmény.

GI alsó SPP-re és pp-re, tehát SPPGI = SPP és ppGI = pp.

Gyakorlatok 4.4-1. A≤

p T

B

A

4.14. deníció alapján fennáll A ≤

⇐⇒

P

A

⊆P

B

p T

B

⇐⇒

A



B

P . Mutassuk meg, hogy

.

4.4-2. Mutassuk meg, hogy a 4.5. példában deniált Pre-Iso halmaz NP-beli, valamint hogy  az N-P-I algoritmus N gépe egy DPOTM, tehát polinomiális idoben dolgozik.

b és H b gráfokhoz az Iso(G b, H) b izomorz4.4-3. Határozzuk meg a 4.6. példában deniált G muscsoportot.  osztályok közül melyek 4.4-4. A következo

ígéret”-osztályok: NP és coNP, RP és coRP, ” AM és coAM, MA és coMA? Tartozhatnak-e az ígéret”-osztályokhoz teljes problémák? A ” válaszokat indokoljuk.

158

4. Bonyolultságelmélet

Feladatok 4-1. Eros  NPOTM  NPOTM, vagyis a végállapotok Egy eros  NPOTM egy három végállapot típussal rendelkezo F halmaza F a , F r és F ? halmazokra bontható. Ekkor teljesül, hogy amennyiben x



A, akkor

B

 M (x) rendelkezik egy olyan úttal, ami egy F a -beli állapotban végzodik, és nem rendelkezik  olyan úttal, amely F r -beli állapotban végzodik. Ha azonban x

<

B

A, akkor M (x) rendelkezik

 egy olyan úttal, ami egy F r -beli állapottal végzodik, és nem rendelkezik olyan úttal, ami B

  F a -beli állapottal végzodik. Az M (x) mindkét esetben végzodhet bizonyos utakon F ? -beli  NPOTM tehát olyan gép, ami nem tudom” válasznak. Az eros ”  két állítást: sosem hazudik. Bizonyítsuk a következo

állapotban, ami megfelel a



A≤

NP



A≤

NP

sT

sT

B

⇐⇒

 NPOTM, mellyel A létezik M eros

B

⇐⇒

NP

A

=

B

L(M ).

⊆ NPB .

Útmutatás. Általánosítsuk a 4.4-1. gyakorlatot. 4-2. Bizonyítás Bizonyítsuk a 4.16. és 4.18. tételek állításait. 4-3. Bizonyítás módosítása Módosítsuk a 4.24. tétel bizonyítását úgy, hogy abból adódjon a 4.25. következmény.

Megjegyzések a fejezethez  tömörített A 3. és 4. fejezetek egyes részei a [400] könyvön alapulnak. Amit itt csak erosen  formában tudtunk bemutatni, ott megtalálható átfogó és minden technikai részletre kiterjedo változatban, terjedelmes példákkal, nagyobb számokkal, szebb és több ábrával, pontosabb magyarázatokkal és kidolgozottabb bizonyításokkal. Ilyen módon megtalálhatók [400]-ben  itt most lemondtunk, mint a 4.16., 4.18. és 4.23. tételek, olyan bizonyítások, melyekrol  valamint a 4.20. lemma bizonyításai. Ehhez képest a 3. és ezen 4. fejezet elonye, hogy  és pontos. rövid, feszes és tömör, mindazonáltal értheto Bonyolultságelmélethez nagyobb háttéranyag található például a [203, 358, 482, 490]  munkájában [470]. A 4.4. és könyvekben. A Turing-gépet Alan Turing vezette be úttöro a 4.5. táblázatot Garey és Johnson [149] készítették. A klasszikus [149] az NP-teljesség elméletéhez még ma is értékes forrásnak számít. A 4.7. tételnél említett több ezer NPteljes probléma egy több száz darabos gyujteménye  szintén megtalálható Garey és Johnson [149] könyvében. A 4.10. tétel bizonyítása megtalálható más könyvekben is, például [149] és [358]. A

 3-SAT probléma determinisztikus idobonyolultságánál említett oszd-meg-

és-uralkodj algoritmust Monien [336], a lokális keresésen alapuló megoldást pedig Dantsin és társai [98] publikálták. A véletlen séta algoritmus Schöning [416, 418] munkáin alapszik. A

p

 ≤T -visszavezethetoséget

Cook [87], a

p

 ≤m -visszavezethetoséget

Karp [241] vezették be.

Ladner, Lynch és Selman [271] cikke átfogó és mélyreható mu  a bonyolultság-korlátozott  visszavezethetoségek tanulmányozásához. A 4.4-1. gyakorlat, valamint a 4-1. feladat alapjait Selman [423] cikke jelenti.  korlátot Dantsin és társai [98] érték el Az eddigi legjobb O(1.481 ) felso n

 minisztikus idobonyolultságára k



k-SAT deter-

3 esetén. Schöning itt bemutatott valószínuségi  algo-

159

4. Megjegyzések a fejezethez

Algoritmus

Típus

3-SAT

vISSZALÉPÉS

det.

O(1.913 )

4-SAT

O(1.987 )

O(1.995 )

Monien és

det.

O(1.618 )

O(1.968 )

Dantsin et al. [98]

det.

O(1.481 )

O(1.6 )

O(1.667 )

O(1.75 )

Paturi et al. [361]

val.

O(1.362 )

O(1.476 )

O(1.569 )

O(1.637 )

Schöning [416]

val.

Iwama és Tamaki [223]

val.

O(1.324 )

O(1.474 )

—

—

n

O(1.928 )

n

n

n

n

n

n

n

O(1.334 )

O(1.5 )

n

n

O(1.6 )

n

n

6-SAT n

O(1.839 )

n

Speckenmeyer [336]

5-SAT n

n

n

n

O(1.966 ) n

n

n

O(1.667 ) n

 4.10. ábra. Néhány – a kielégíthetoség problémát megoldó – algoritmus futási ideje.

ritmusa a mához k

korlátozott lokális keresés ismétléssel” [416] ötleten alapszik. A k-SAT problé” 4 mellett Paturi és társai [361] algoritmusa kissé még jobb. A jelenlegi legjobb



valószínuségi  algoritmus

3-SAT-hoz

és

4-SAT-hoz

Iwama és Tamaki [223] munkáján ala-

 algoritmusuk ügyesen ötvözi Paturi et al. [361] és Schöning [416] algoritmusait, pul. Az o   és megközelítoleg O(1.324 ) futási idovel rendelkezik. A n

k-SAT

ezen algoritmusa k



5

mellett nem jobb mint Paturi et al. [361] algoritmusa.  A 4.10. ábra áttekintést nyújt a fejezetben tárgyalt és néhány további kielégíthetoség problémát megoldó algoritmusról. A jelenlegi legjobb algoritmusok félkövér szedéssel szerepelnek. A grázomorzmus problémával Köbler, Schöning és Torán [247] könyve foglalko zik átfogó jelleggel, elsosorban bonyolultságelméleti szempontok szerint. Hoffman [208] csoportelméleti algoritmusokat vizsgált

GI-hoz.

A 4.11. tételt Ladner [270] publikálta, az

alacsony- és magas bonyolultsági osztályhierarchiákat Schöning [414] vezette be. A 4.13. tételnél használt lexikograkus rendezés megtalálható Rothe [400] cikkében. Gál et al. [155] mutatták meg, hogy teljes izomorzmus konstruálható O(lg n) méretu  parciális izomorzmusból két, egyenként n csúcsú izomorf gráfhoz. Ezt az eredményt a 4.13. tétel optimálisra  Ezen javítja fel, kimondja, hogy ehhez már egy 1 méretu  parciális izomorzmus is elegendo. tétel, valamint a 4.6. példa Größe, Rothe és Wechsung [177] munkájára alapszik. A poli nomiális ido-hierarchiát Meyer és Stockmeyer [323, 440] vezették be, akik bizonyították  többek között a 4.16. tétel állításait. Az alsó- és felso-hierarchiát Schöning vezette be [414], valamint bizonyította a 4.18. tétel állításait [414] és megmutatta, hogy  Köbler et al. [245, 246] közöltek eloször eredményeket

GI

GI Low2 -beli [415].

alsóságára vonatkozóan való-

színuségi  osztályok, mint amilyen pp ellenében. Eredményeiket Arvind és Kurur [20] javították, akik bebizonyították, hogy

GI

még SPP-beli is. Az univerzális hasítás módszerét

Carter és Wegman [69] írták le 1979-ben. A 4.20. lemma Carter és Wegman [69] munkáján alapszik. Az SPP a Valiant [475] által bevezetett UP osztály általánosítása. Az SPP és más

ígéret” osztályok alapos tanulmányozásával számos munka foglalkozik, például ” [20, 56, 127, 194, 245, 246, 382, 399], a 4.23 tételben felsorolt tulajdonságok is megtalálhatók ezen muvekben  [127, 246, 247]. A 4.26 tétel bizonyításához szükséges Turingekvivalenciát

AUTO és GI problémák közt Mathlon [312] mutatta meg (lásd még [247]).

Magyar nyelvu,  bonyolultságelmélettel foglalkozó szakkönyvek Cormen, Leiserson, Rivest és Stein [90], Lovász [297], Papadimitriou [358], valamint Rónyai Lajos, Ivanyos  Gábor és Szabó Réka [392] muve.  köszönetet mond Uwe Schöning-nek hasznos észrevételeiért ezen fejezet A szerzo  egy korábbi változatához. Leginkább Uwe Schöning eloadásfóliáin alapul a 4.3. alfejezet R-SAT algoritmusának valószínuségi  elemzése, amely az eredeti érvelés egy egysze-

160

4. Bonyolultságelmélet

rusítése.  Ennek részletesebb elemzése olvasható könyvében [417]. Ezen kívül hálás köszönet illeti Dietrich Stoyant, Sigurd Assingt és Holger Spakowskit a 3. és 4. fejezetek korábbi  a Német Kutatási Társaság (Deváltozatainak korrektúra-olvasásáért. Támogatta a szerzot utsche Forschungsgemeinschaft – DFG) a RO 1202/9-1 azonosítószám alatt.

II. HÁLÓZATOK

Bevezetés

 áll. Ez a rész három fejezetbol Az ötödik fejezet hálózatok szimulációjával foglalkozik. A hatodik fejezet címe Párhuzamos számítások. A fejezetben áttekintést adunk a párhuzamos számításokhoz használt leggyakoribb architektúrákról, bemutatjuk a legnépszerubb   informatikai feladaok megoldásra alkalmas párhuszámítási modelleket és végül alapveto zamos algoritmusokat mutatunk be.  szóló alapveto  ismereteket rendszerezi, A hetedik fejezet a szisztolikus rendszerekrol és bemutatja néhány ismert módszer szisztolikus rendszerekkel való megvalósítását.

5. Hálózatok szimulációja

Ebben a fejezetben olyan módszereket és technikákat tárgyalunk, melyekkel szimulálhatjuk  hálózati számítógéprendszerek és alkalmazások muködését. különbözo  Egy hálózati rendszer vagy alkalmazás teljesítményének a hálózat zikai megépítését, illetve az alkalmazás  o  jellemzésére a hálózattervezés és menedzselés területén a szimuláció kibocsátását megeloz az egyik legelterjedtebb módszer.

5.1. A szimuláció típusai 5.1.1. Rendszerek, modellek és diszkrét-esemény szimuláció Egy hálózati rendszer hálózati elemek – mint például a forgalomirányítók, kapcsolók, kapcsolatok, felhasználók és alkalmazások – olyan halmaza, melynek elemei együttmuködnek  valamilyen cél érdekében. A szimulációs tanulmány tárgya lehet egy olyan rendszer is, mely része egy másik rendszernek, mint például egy alhálózat. A hálózati rendszer állapota azoknak a lényeges változóknak és paramétereknek a halmaza, melyek leírják a rendszert egy  bizonyos idoben, mely magában foglalja az adott dolog vizsgálatát. Például, ha egy kapcsolat kihasználtságára vagyunk kíváncsiak, akkor csak a link által másodpercenként átvitt bitek számát és a kapcsolat teljes kapacitását akarjuk tudni, és nem a kapcsolat által összekötött kapcsolókban az egyes kapuk számára rendelkezésre álló puffermennyiséget. A hálózat zikai modelljének megépítése helyett egy matematikai modellt építünk,  logikai és mennyiségi kapmely tükrözi a hálózatelemek muködését  és a közöttük lévo csolatokat. A hálózatelemek közötti kapcsolatok megváltoztatásával a hálózatot annak zikai megépítése nélkül elemezhetjük azt feltételezve, hogy a modell a valós rendszerhez hasonlóan viselkedik, tehát ez egy érvényes modell. Például, a kapcsolat kihasználtságát analitikusan kiszámíthatjuk az U

=

 alatt D/T képlet felhasználásával, ahol D az adott ido

elküldött adatmennyiség, T pedig a kapcsolat kapacitása bit/másodpercben. Ez nagyon egyszeru  modell, amely ritkán alkalmazható valós feladatok esetén. Sajnos, a problémák nagy  kérdéseket egyszeru része túl bonyolult ahhoz, hogy a felmerülo  matematikai egyenletekkel megválaszolhassuk. A nagyon bonyolult esetekben a szimulációs technika jobb. A szimulációs modellek többféleképpen osztályozhatók. A leggyakoribb osztályozások  a következok.

5.2. A telekommunikációs hálózatok modellezésének és szimulációjának szükségessége



165

 ol  függetlenül Statikus és dinamikus szimulációs modellek. A statikus modell az idot  jellemzi a rendszert. A dinamikus modell pedig egy idoben változó rendszert ír le.



Sztochasztikus és determinisztikus modellek. Ha a modell egy olyan rendszert ír le,  függo  elemeket tartalmaz, akkor sztochasztikus modellnek nevezzük, amely véletlentol egyébként determinisztikusnak. A hálózati modelleket megalapozó sorbanállási rendszerek véletlenszeru  komponenseket tartalmaznak, mint például a csomagok beérkezési ideje egy adott sorba, a sorok kiszolgálási ideje, egy kapcsoló kapu kimenete stb.



Diszkrét és folytonos modellek. A folytonos modell egy olyan rendszert ábrázol, mely nek változói idoben folyamatosan változnak. Például a differenciálegyenletek deniál váltoják az összefüggéseket egyes állapotváltozók változásának a mértékére az ido zása szerint. Egy diszkrét modell egy olyan rendszert jellemez, ahol az állapotváltozók   diszkrét idopillanatokban változnak meg. Az egyes események ezekben a diszkrét ido és változtathatják meg a rendszer állapotát. Például, egy pontokban fordulhatnak elo  csomag érkezése egy forgalomirányítóhoz egy bizonyos idopillanatban egy olyan esemény, amely megváltoztatja az forgalomirányító kapu-pufferének állapotát. A továbbiakban mi dinamikus, sztochasztikus és diszkrét modelleket tételezünk fel, és

diszkrét-esemény szimulációs modellekként hivatkozunk rájuk. A számítógépes kommunikáció összetett természetének következtében a hálózati modellek is összetettek. A számítógépes programok fejlesztése az egyes szimulációs problé  mákra egy lehetoség, de ez nagyon sokáig tart és nem hatékony. Az utóbbi idoben a szi csomagok alkalmazása szokásossá vált, ami megtakarítja a kódolási mulációs és modellezo  és lehetové   számára, hogy a programozási részletek helyett a moidot teszi a modellezo  pillantásra ezeknek a hálózatszimulációs és modellezési problémára koncentráljon. Elso dellezési csomagoknak – mint például a COMNET, OPNET – használata azzal a veszéllyel  jár, hogy a modellezonek meg kell bíznia olyan modellezési technikákban és rejtett eljárá alfejesokban, amelyek jogilag védettek lehetnek, valamint nem nyilvánosak. A következo   zetekben azt tárgyaljuk, hogy a szimulációs módszertan hogyan gyozi le az elobb említett félelmeinket az érvényesítési eljárások alkalmazásával, melyek célja, hogy megbizonyosodjunk arról, vajon a valós hálózati rendszer ugyanúgy muködik-e  majd, mint ahogyan azt a  szimulációs modell elorejelezte.

5.2. A telekommunikációs hálózatok modellezésének és szimulációjának szükségessége 5.2.1. Szimuláció és emuláció Az egyre több adat, számítógép, tároló rendszer és hálózat világában a rendszerek tervezése és menedzselése egyre nagyobb kihívássá válik. Amint a hálózatok gyorsabbá, nagyobbá és bonyolultabbá válnak, a hagyományos számítások már nem ésszeru  megközelítései az új hálózati technológiáknál egy új hálózatterv megvalósításának és több millió dolláros befektetéseknek az érvényesítésénél. Ezek a bonyolult számítások és táblázatok már nem meg eszközök a hálózati forgalom sztochasztikus természete, valamint az egész rendszer felelo összetettsége miatt.

166

5. Hálózatok szimulációja

 szervezetek egyre inkább azoktól az új hálózati technológiáktól és hálóA különbözo zati alkalmazásoktól függenek, melyek támogatják az üzleti szükségleteiket. Ennek eredményeképp, a gyenge hálózat-teljesítménynek súlyos következményei lehetnek az üzleti  alternatív tevékenységúkre nézve. Az egyes tervezési célok eléréséhez tartozó különbözo  egyre inkább számítanak az olyan módszemegoldások kiértékelésében a hálózattervezok   döntés meghozatala rekre, melyek segítik oket a számos javaslat kiértékelésében a végso  és a valódi rendszer megépítése elott. Egy szélesköruen  elfogadott módszer a szimulációs   használhat egy szimulációs modellt a tervezési teljesítmény-elorejelzés. A hálózattervezo  rendszer módosításainak tanulmányováltozatok elemzésére és egy új, vagy egy már létezo zására azok zikai megépítése nélkül. Egy szimulációs modell tükrözheti egy hálózat topológiáját és a hálózatban elvégzett feladatokat, hogy segítségével statisztikai eredményeket  kapjuk a hálózat teljesítményérol. Fontos a szimuláció és az emuláció közötti különbség megértése. Az emuláció célja az, hogy utánozza az eredeti hálózatot, és reprodukáljon minden eseményt, amely az egyes hálózatelemekben és alkalmazásokban bekövetkezik. Szimuláció esetén a cél az, hogy olyan  amelyek kifejezik az egyes hálózatelemek viselkestatisztikai eredményeket állítsunk elo, dését és funkcióit. Egy diszkrét-esemény szimuláció során meg akarjuk gyelni az esemé  nyeket, amint azok megtörténnek az adott idoben, és teljesítmény-jellemzoket szeretnénk  mint pélmeghatározni, hogy következtetéseket vonhassunk le a hálózat teljesítményérol,  ol,  a forgalomirányítók puffereinek médául a kapcsolat-kihasználtságokról, a válaszidokr  stb. reteirol A nagyon sok hálózatelemet tartalmazó hálózatok szimulációja esetén olyan nagy mo dellt kaphatunk, amelynek elemezése a szimuláció alatt eloállított nagy mennyiségu  statisztika miatt bonyolult. Ezért ajánlatos a hálózatnak csak azon részeit modellezni, amelyek  lényegesek a szimulációval megkapni kívánt statisztikákat illetoen. Továbbá szükségszeru,  hogy a modell csak azokat a részleteket tartalmazza, amelyek a szimuláció céljai miatt fon általában a következo  célokat tuzik tosak. A hálózattervezok  ki:



 Teljesítménymodellezés. Statisztikák eloállítása a kapcsolatok, forgalomirányítók, kap csolók, pufferek stb. teljesítmény paramétereirol.

• •

Hibaelemzés. A hálózatelemek hibás muködése  következményeinek elemzése.  hálózattervek statisztikáinak összehasonlítása az egyes terHálózattervezés. Különbözo vezési javaslatok követelményeinek kiértékelése céljából.



Hálózati eroforrások  tervezése. Olyan változtatások hatásának mérése a hálózat teljesítményén, mint pl. az új felhasználókkal, alkalmazásokkal vagy hálózatelemekkel való  bovítés.   szimulációs modellekre lehet A céloktól függoen ugyanahhoz a hálózathoz különbözo

 meg akarja határozni egy protokoll új szolgáltatása által szükség. Például, ha a modellezo okozott többletterhelést a kommunikációs kapcsolatokon, akkor a modell linkjeinek csak   egy az új szolgáltatás által eloállított forgalmat kell reprezentálnia. Ha viszont a modellezo  alkalmazás válaszidejét akarja vizsgálni maximális forgalom-terhelés esetén, akkor melloz o  modellbeli protokoll új szolgáltatásának megfelelo  forgalmat. heti az eloz Egy másik fontos kérdés a modell nomsága, azaz hogy milyen szintu  részletekig modellezzük az egyes hálózatelemeket. Például el kell döntenünk, hogy egy forgalomirányító  felépítését akarjuk modellezni, vagy pedig egy egész csomagkapcsolt hálózatot. Az belso  esetben meg kell adnunk a forgalomirányító belso  komponenseit, a processzorok száelso

5.3. A telekommunikációs hálózatok típusai

167

mát és sebességét, a buszok típusait, a kapuk számát, a kapu-pufferek mennyiségét továbbá az ezen komponensek közötti kölcsönhatásokat is. De ha alkalmazásszinten akarjuk vizs az egész csomagkapcsolt hálózatban, akkor a forgalomirányítók belso  gálni a válaszidot részletei helyett inkább az alkalmazások és protokollok típusait, a hálózat topológiáját és a kapcsolatok kapacitását kell meghatároznunk. Habár a forgalomirányítók alacsonyszintu   muködése  hatással van a végpontok közötti válaszidore, ennek részletes modellezése az egész hálózatot tekintve nem járul hozzá meghatározóan a szimulációs eredményekhez. A  muködési nanoszekundum nagyságrendu  belso  részletek modellezése nem járul hozzá je lentosen a végpontok közötti mikroszekundum vagy másodperc nagyságrendu  késleltetés  további pontosságot erosen  vizsgálatához. A nagyobb modell-nomságból eredo ellensúlyozza a modell bonyolultsága, és ezeknek a részleteknek a modellbe foglalása által igényelt  munka és ido. Az egyszerusítés  történhet statisztikai függvények alkalmazásával is. Például a cellahibákat egy ATM hálózatban nem feltétlenül kell úgy modellezni, hogy egy kommunikációs  rossz CRC-t a kapcsolaton a cella fejlécében megváltoztatunk egy bitet, ezáltal idézve elo fogadónál. Használhatunk egy statisztikai függvényt is annak eldöntésére, hogy egy cella megsérült vagy elveszett-e, tehát így a cella részleteit nem kell megadnunk a cellahibák modellezéséhez. Ezek a példák azt szemléltetik, hogy a hálózatszimuláció célja nem a hálózat emuláci reprodukciója. ója, hanem a funkcionalitás bizonyos vizsgálatok céljára történo

5.3. A telekommunikációs hálózatok típusai 5.3.1. Modellezési konstrukciók  csomópontokból (küldokb   és fogadókból) Egy kommunikációs hálózat hálózatelemekbol, ol   kommunikációs közegekbol  áll. A számos hálózat osztályozási kritéés az oket összeköto  használunk: az átviteli technológiát és méretet. A méret vagy távolság rium közül mi kettot szintén meghatározza a hálózatban alkalmazott technikát, amely például lehet vezetékes vagy vezetéknélküli. Két vagy több hálózat összekapcsolását internetworknek nevezzük. A legismertebb internetwork az Internet.  Az átviteli technológiától függoen nagyjából két csoportba oszthatjuk a hálózatokat, üzenetszórásos és pont-pont kapcsolatú hálózatok:



Az üzenetszórásos hálózatokban egy kommunikációs csatorna van megosztva az összes csomópont között. A kommunikáció úgy történik, hogy a csomópontok a minden más  cím csomópont által küldött csomagokat vagy kereteket is megkapják. A keretben lévo határozza meg a címzettet vagy címzetteket, és csak a címzett csomópontok dolgoz zák fel a keretet. Az üzenetszórásos technológiák azt is lehetové teszik, hogy a keretet az összes csomópontnak címezzük. Az ilyen üzenetszórásos kereteket a hálózat összes csomópontja feldolgozza. A kereteket címezhetjük csomópontok egy csoportjának a   tagjainak is, vagy közülük egy tetszoleges csomópontnak is. Az elobbit többesküldésnek, az utóbbit bárkinek való küldésnek nevezzük.



A pont-pont kapcsolatú hálózatok csomópontpárok közötti kapcsolatok sokaságából  ol  egy adott címzetthez küldött csomagot vagy keretet esetleg állnak. Itt egy adott küldot

168

5. Hálózatok szimulációja

más csomópontokon keresztül kell továbbítani. Ezek tárolják és továbbítják azt, amíg el nem éri célját. A másik osztályozási szempont, vagyis a lefedett zikai terület nagysága alapján a kö vetkezoképpen csoportosíthatjuk a hálózatokat:



A személyes hálózati környezetek (Personal Area Network – PAN) egy adott személy  egérbol  és PDA-ból ( Personal Digital igényeit elégítik ki. Például egy billentyuzetb  ol, ” Assistant” – Digitális Személyi Asszisztens – mozaikszava) álló, vezetéknélküli hálózat  egy személyes hálózati környezetnek. tekintheto



A helyi hálózatok (Local Area Network – LAN) egy korlátozott méretu  területet fednek le, tipikusan magánszemélyek, részlegek, kisebb otthoni szervezetek vagy épületek  adott emeletei birtokolják oket. A helyi hálózat munkaállomásokat, kiszolgálókat és  megosztott eroforrásokat kapcsol össze. A LAN-ok csoportosíthatók továbbá az átviteli technológia (melynek sebességét bit/másodpercben mérjük) és a hálózati topológia szerint. Az átviteli technológiák sebessége a hagyományos 10 Mbps-tól 10 Gbps sebességuig  terjed. Topológia szerint vannak busz és gyur  u  hálózatok, továbbá kapcsolt LAN-ok.



A városi hálózatok (Metropolitan Area Network – MAN) nagyobb területet hidalnak át, például egy várost. Egy szélesköruen  alkalmazott MAN a kábel-tv hálózat, amely nem csak az egyirányú TV adásokat, hanem kétirányú Internet szolgáltatásokat is biztosít az átviteli spektrum nem használt részében. Más MAN technológiák például az optikai  szálas elosztott adatinterfész és a következokben tárgyalt vezetéknélküli IEEE (Institute of Electrical and Electronical Engineers) technológiák.



A nagy kiterjedésu  hálózatok (Wide Area Network – WAN) nagy földrajzi területet fednek le, egy államot, országot vagy akár egy kontinenst is. Egy WAN alhálózatokban  és szerverekbol)  áll. Az alhálózatok továbbítják összekapcsolt hosztokból (kliensekbol az üzeneteket a forrástól a cél hosztig. Egy alhálózat tartalmazhat számos átviteli vonalat, melyek mindegyike speciális hardver eszközöket, úgynevezett forgalomirányítókat  közeg is lehet, rézdrót, optikai üvegszál, kapcsol össze. Az átviteli vonal több különbözo vezetéknélküli kapcsolat stb. Mikor egy üzenetet el kell küldeni egy vagy több hosztnak,  az üzenetet kisebb részekre osztja, melyeket csomagoknak nevezünk. Amikor a küldo egy csomag megérkezik egy átviteli vonalon, a forgalomirányító tárolja azt, kiválaszt  vonalat és azon továbbítja. A kimeno  vonal kiválasztása egy forgalomiráegy kimeno nyítási algoritmus alapján történik. Végül az egyesével továbbított csomagokból a cél hoszt(ok) újra összeállítják az eredeti üzenetet.  osztályokba sorolhatók: rövidtávú rádióA vezetéknélküli hálózatok a következo

hálózatok, vezetéknélküli LAN-ok és vezetéknélküli WAN-ok.



Rövidtávú hálózatoknál az egyes eszközök 6–10 méteren belül vannak összekapcsolva  komponensek, rövidtávú rádiókapcsolatokkal. Ilyenek például a Bluetooth, a különbözo digitális kamerák, a globális helymeghatározó rendszer ( Global Positioning System” ” – GPS) eszközei, a fejhallgatók, számítógépek, szkennerek, monitorok és billentyuze   rendszeregység, tek. A komponensek elsodleges-másodlagos viszonyban vannak. A fo   az elsodleges komponens irányítja a másodlagos komponensek muködését.  Az elsodleges komponens határozza meg, hogy milyen címeket használnak a másodlagos eszközök, továbbá, hogy melyik frekvenciákon továbbíthatnak adatokat.

5.4. Teljesítményjellemzok  szimulációhoz



169

 és rádió-modemmel és antennával felszerelt A vezetéknélküli LAN számítógépekbol  hozzáférési pontokból áll, melyek lehetové teszik az adatok küldését és fogadását. A számítógépek kommunikálhatnak egymással közvetlenül vagy egy hozzáférési ponton  keresztül, ami más hálózatokhoz is kapcsolhatja oket. A lefedett terület általában 100 méter körül van. A vezetéknélküli LAN protokollok az IEEE 802.11 szabványok családjába tartoznak, és 11-108 Mbps sebességet biztosítanak.



A vezetéknélküli WAN-ok lehetnek kis és nagy sávszélességu  hálózatok is. A kis sávszélességu  rádió-hálózatok eddig kifejlesztett három generációját a celluláris telefon generációt csak hang-kommunikációra tervezték, ez rendszerek használják. Az elso analóg jelzést használt. A második generáció szintén csak hangot továbbított, de digitális átviteli technológiára alapozva. Az aktuális harmadik generáció digitális és hangot és adatokat is továbbít legfeljebb 2 Mbps sebességgel. Negyedik és további generációs celluláris rendszerek is fejlesztés alatt vannak. A nagy sávszélességu  WAN-ok a telefonrendszerek használatát elkerülve biztosítanak nagy sebességu  hozzáférést az ottho Az IEEE 802.16 szabvány az IEEE 802.11 szabvánnyal ellentétben nokból és cégektol. épületekhez és nem mobil állomásokhoz továbbítja a szolgáltatásokat, és sokkal magasabb, 10–66 GHz frekvencia-tartományban üzemel. A távolság az épületek között több kilométer is lehet.



 Interneten keresztül elA vezetékes és vezetéknélküli otthoni hálózatok a különbözo,  eszközök összekapcsolásával egyre inkább népszerubbek érheto  lesznek. Az otthoni  laptopokból, PDA-kból, TV-kbol,  DVD-kbol,  videókahálózatok állhatnak PC-kbol,   hut   lámpákból, merákból, MP3 lejátszókból, mikrohullámú sütokb ol,  oszekrényekb ol,   stb. Sok háztartás ma már fel van szerelve nagy riasztókból, kihasználtság-mérokb ol sebességu  Internet-hozzáféréssel (kábel modem, DSL stb.), amin keresztül igény szerint tölthetnek le zenét és lmeket.

 komponensei és típusai megfelelnek a szimulációs A kommunikációs hálózatok különbözo  lépéseinek. Tipikusan a hálózati topológiát épímodellépítés konstrukcióinak és különbözo  tik fel eloször, majd hozzáadják a forgalom forrásait, céljait, a terhelést és a hálózati mukö  paraméterek meghatározzák a kísérledés paramétereinek beállítását. A szimulációt vezérlo  a szimuláció alatti és utáni elemzéstet és a szimuláció lefutását. A szimuláció indítása elott  statisztikai jelentések aktiválhatók. Statisztikai eloszlások állnak rendelkehez különbözo zésre ahhoz, hogy leírjuk a beépített analitikus eloszlások speciális paraméterezéseit. Amint  új modellkönyvtárakat készíthet, melyek újra felhasználhaa modell elkészült, a modellezo tók más modellekben is.

5.4. Teljesítményjellemz®k szimulációhoz 5.4.1. Teljesítménymértékek   listáját tekintjük át, Ebben az alfejezetben a hálózatok olyan jellemzoinek egy nem kimeríto  melyek meghatározó hatással vannak a hálózat teljesítményére. Általában ezek a jellemzok képezik a hálózat-modellezésnek, azaz a számítógéphálózatok statisztikai elemzésének,  tervezésének és optimalizálásának céljait. Alapvetoen a hálózatmodelleket úgy készítjük,

170

5. Hálózatok szimulációja

hogy megadjuk egy sorbanállási rendszerben az igény érkezési és kiszolgálási intenzitások  statisztikai eloszlását, ami azután meghatározza ezeket a jellemzoket.



 Kapcsolat kapacitás. A csatorna vagy kapcsolat-kapacitás a kapcsolat által idoegységenként továbbított üzenetek száma. Ezt általában bit/másodpercben mérik. Az információelmélet egyik leghíresebb eredménye Shannon csatornakódolási tétele:

Minden ”  csatornára létezik olyan kód, ami lehetové teszi a csatornán való hibamentes adattovábbítást R intenzitással, feltéve, hogy R



 C, ahol C a csatorna kapacitása.” Egyenloség

csak akkor lehetséges, ha a jel/zaj hányados ( Signal-to-Noise Ration” – SNR) végte” len.



Sávszélesség. A sávszélesség a hálózati jelek számára rendelkezésre álló legalacsonyabb és legmagasabb frekvenciák közötti különbség. A sávszélesség kifejezést szintén  használják egy adott kapcsolat vagy protokoll áteresztoképességének leírására, kilobit, megabit, terabit stb. /másodpercben mérve.



 amire a hálózati rendszernek szüksége van ahhoz, Válaszido.  A válaszido  az az ido,  tartalmazza a célállomáshoz hogy megválaszolja egy igényforrás kérését. A válaszido  a forrásnál, a célnál, valamint a közbeeso  hávaló továbbítás idejét, a feldolgozási idot lózatelemeknél, továbbá tartalmazza a válasznak a forráshoz való átvitelének idejét. Az  a hálózat teljesítményének fontos mértéke. A felhasználók számára átlagos válaszido  a legkedvezobb.   statisztikáknak (átlag és szórás) a minél kisebb válaszido A válaszido állandóknak kell lenniük, és nem szabad, hogy napszaktól függjenek. Meg kell jegyez nem garantálja azt, hogy nem lesznek nünk viszont, hogy az alacsony átlagos válaszido  is. hálózati torlódások miatt rendkívül hosszú válaszidok



 Késés. A késés vagy késleltetés az az idomennyiség, ami egységnyi adatnak egy hálózati kapcsolaton való továbbításához szükséges. A késleltetés és a sávszélesség az a két té ami meghatározza egy kapcsolat sebességét. A késleltetés tartalmazza a terjedési nyezo,  ami alatt az elektronikus vagy optikai jelek megteszik a két pont késleltetést (azt az idot,  Például egy földi állomásnak egy másik földi közötti távolságot) és a feldolgozási idot. állomással való muholdas  kommunikációs kapcsolatának késése (legalább 34000 km mindkét út) körülbelül 270 milliszekundum. Az USA keleti és nyugati partjai közötti válaszolási késleltetés körülbelül 100 milliszekundum, globálisan 125 milliszekundum.  álló adatútnak a forrás és cél végpontok közötti késleltetését Egy több szegmensbol  hálózati eszközök, fornem csak a jel terjedési sebessége, hanem az útvonalon lévo galomirányítók, kapcsolók is befolyásolják, melyek tárolják, feldolgozzák, irányítják, kapcsolják, és becsomagolják az adatokat. A hibás csomagok és cellák, a jelveszteség, a kapcsolat és eszközhibák, valamint túlterhelések szintén hozzájárulnak a hálózati késleltetéshez. Hibás cellák és csomagok esetén szükség van azoknak a forrástól való teljes  újraküldésére. Az ilyen a csomagokat általában eldobják – azt feltételezve, hogy késobb  újraküldik oket. Ez lassulást és a pufferek túlcsordulását okozhatja.



Forgalomirányító protokollok. A forrástól a célig a hálózati forgalom valamilyen útvonalon halad keresztül. Egy helyi hálózatban ez az útvonal nem egy problémás kérdés, mivel csak egy út lehetséges bármely forrás és cél között. Ha viszont a hálózat számos céget kapcsol össze számos útvonallal, forgalomirányítóval és kapcsolattal, a legjobb  út vagy útvonalak megkeresése igen fontossá válik. Egy útvonal többféle különbözo kapacitású, késleltetésu  és megbízhatóságú kapcsolatból állhat. Létesítésük forgalomirányító protokollok segítségével történik. Ezeknek a protokolloknak az a célja, hogy a

5.4. Teljesítményjellemzok  szimulációhoz

171

torlódást elkerülve egy optimális, vagy közel optimális útvonalat találjanak a forrás és a cél között.



Forgalomszervezés. A forgalomszervezés koncepcióját felhasználva jelenleg egy újfajta forgalomirányítási technikát fejlesztenek. A folyamatos hálózatkapacitás-növelés he lyett inkább a hálózati eroforrások optimális kiosztását alkalmazzák a torlódások elkerülésére. A forgalomszervezést úgy valósítják meg, hogy a forgalomfolyamokat a   cél zikai hálózati topológiára képezik le elore meghatározott útvonalak mentén. Fo a forgalomirányítók és kapcsolók továbbító kapacitásainak optimális kiosztása. A for galomszervezés megteremti annak lehetoségét, hogy a forgalomfolyam eltérjen a hagyományos forgalomirányítási protokollok által kiszámított optimális útvonaltól egy kevésbé zsúfolt hálózatrész felé. Kiegyenlíti a terhelést a kapcsolatokon, forgalomirányítókon és kapcsolókon úgy, hogy ezen hálózatelemek egyike se legyen túl kevéssé vagy túlságosan is kihasználva.



Protokoll többletterhelés. A protokollüzenetek és az alkalmazások adatai protokolladategységekbe vannak ágyazva, mint például keretek, csomagok és cellák. A hálózat egyik fo  aggálya a protokollok többletterhelése. Ez a többletterhelés a követtervezok  kérdést veti fel. Valójában milyen gyorsan tudunk adatokat továbbítani egy adott kezo kommunikációs útvonallal és protokollcsomaggal, azaz mekkora sávszélesség marad valójában az alkalmazásoknak? A legtöbb protokoll további többletterhelést is bevezet sávszélességen belüli protokoll-menedzselési funkciókkal kapcsolatban. A kapcsolat és ellenorz  o  üzenetek, a poll, select és fenntartó csomagok, hálózati riasztások, vezérlo  jelzoüzenetek  különbözo az adatfolyamokkal együtt továbbítódnak.



 ingadozása. Eros  ingadozás. A hálózati torlódás leggyakoribb oka a forgalom eros Egyes nem régi eredmények nyilvánvalóvá tették a nagy sebességu  Internet forgalmá nak erosen ingadozó voltát és azt, hogy a változékonysága a korábbi feltételezésekkel  elore.  szemben nem jelezheto Megmutatták, hogy a hálózati forgalom gyakran hasonló  statisztikai tulajdonságokkal rendelkezik. A gyakran vagy mindig erosen ingadozó forgalom statisztikailag leírható a hosszú távú függoség  fogalmának felhasználásával. A  forgalomnak mindig meggyelheto  eros  ingadozása. Az elobbiek  hosszú távon függo  adatfolyamok összekeverése, mint ahogyan egyik következménye az, hogy a különbözo az az Interneten is történik, nem eredményez egyenletes forgalmat. A helyi és nagy kiterjedésu  hálózatokban végzett mérések bebizonyították, hogy a szélesköruen  használt Markov-folyamaton alapuló modellek nem alkalmazhatók napjaink hálózati forgalmá ingadozás kiegyenlítodne  nak leírására. Ha a forgalom Markov-folyamat lenne, az eros  egy hosszú idointervallum átlagolása során, ellentmondva a meggyelt forgalomjellem   zoknek. Az erosen ingadozó forgalom káros következményeit a 5.9. alfejezetben lévo esettanulmányban vizsgáljuk meg.



 gyakran aggódnak a nagyméretu Keret méret. A hálózattervezok  keretek miatt, ugyanis az ilyen elveszett keretek és újraküldésük esetén sokkal gyorsabban fel tudják tölteni a forgalomirányítók puffereit mint a kisebbek. Mivel a feldolgozási késleltetés ugyanakkora a nagyobb kereteknél, mint a kisebbeknél, azaz a nagyobb csomagok látszólag hatékonyabbak, de a forgalomirányítók és kapcsolók gyorsabban fel tudják dol soraikat kisebb csomagok esetén. A nagyobb keretek esetén szükség lehet gozni a belso azok feldarabolására is, mivel a maximális adatátviteli egység ( Maximum Transmis” sion Unit” - MTU) mérete korlátozza a méretüket. Az MTU egy olyan paraméter, ami

172

5. Hálózatok szimulációja

 legnagyobb csomag méretét. Másrészt, a meghatározza egy IP interfész által átviheto kisebb keretek több ütközést okozhatnak az Ethernet hálózatokban vagy kisebb kihasználtságot a WAN kapcsolatokon.



Az eldobott csomagok aránya. A csomagok az OSI architektúra adatkapcsolati és hálózati rétegében kerülhetnek eldobásra. A szállítási réteg puffereket kezel a nyugtázat lan csomagok számára, és szükség esetén újraküldi oket, hogy ezáltal egy hibamentes  és a fogadó között. Az alsóbb rétegekben eldobott csokapcsolatot biztosítson a küldo magok aránya meghatározza a szállítási rétegben újraküldött csomagok arányát. A for pufferek hiánya miatt is eldobhatnak csomagokat. galomirányítók és kapcsolók a belso  Ha a WAN kapcsolatok zsúfolttá válnak, akkor a pufferek gyorsabban feltöltodnek, ami  pedig idotúllépéseket és újraküldéseket okoz a szállítási rétegben. A TCP lassú indulás  folyamatos becslésével és a továbbítási intenzitásnak a korábbi algoritmusa a válaszido  beállításával próbálja elkerülni a torlódást. ingadozásától függo

5.5. A forgalom jellemzése 5.5.1. Hálózati statisztikák  függo  jellemzokkel  A kommunikációs hálózatok véletlentol továbbítják az adatokat. A há lózat jellemzoinek mértékei véletlen folyamatokból vett statisztikai minták. Ilyen például a  a kapcsolat kihasználtság, az üzenetek beérkezési idoköze  válaszido, stb. Ebben az alfejezetben áttekintjük a hálózatmodellezésben és teljesítménybecslésben legfontosabb statisztikákat.   eloszlástípus kiválasztása után a következo  A vizsgált hálózatjellemzonek megfelelo lépés az eloszlás paramétereinek becslése. Erre sok esetben a minta átlagát vagy közepét és szórását használják. A fejlettebb szoftver-eszközök tartalmazzák a szükséges számításokat  mint az az érték, ami körül a minta értéezekhez a becslésekhez. Az átlag úgy értelmezheto,  egyenletek akkor alkalmazhatók, ha rendelkezésre állnak kei csoportosulnak. A következo diszkrét vagy folytonos alapadatok. Legyen X1 , X2 , . . . , Xn a rendelkezésre álló, n méretu   képlet adja meg: minta. Ennek az átlagát a következo

Pn

X A minta S

2

i= 1

=

Xi

n

.

 szórásnégyzete pedig a következoképpen deniálható:

Pn S

2

=

i=1

Xi n

2

− nX

2

.

−1

 Ha az adatok diszkrétek és egy gyakorisági eloszlásba vannak csoportosítva, akkor az elobbi  egyenletek a következoképpen módosulnak: k P

X

= k P

S

2

=

j=1

j=1

f jX j

,

n f jX j n

2

− nX

−1

2

,

173

5.5. A forgalom jellemzése

eloszlás

paraméter(ek)

becslés(ek)

Poisson exponenciális

α λ

egyenletes

b

normális

µ, σ2

ሠ= X λˆ = 1/X ˆ = ((n + 1)/n)[max(X)] (torzítatlan) b µˆ = X 2 2 σ ˆ = S (torzítatlan)

5.1. ábra. Leggyakoribb eloszlások paramétereinek becslése.

 értékeinek száma, f j pedig az X j érték gyakorisága. Az S szórás az ahol k az X különbözo S

2

szórásnégyzet négyzetgyöke. A szórásnégyzet és a szórás szemlélteti a mintáknak az átlagérték körüli eltérését. A kis

 középre irányuló tendenciáját mutatja. A nagy eltérés viszont eltérés a mintáknak egy eros, kis tendenciát és nagy statisztikai véletlenszeruséget  mutat. Az eloszlás paramétereinek numerikus becslései azért szükségesek, hogy az adott eloszláscsaládot egy eloszlásra redukálhassuk és tesztelhessük az adott feltevést. Az 5.1. ábra  a hálózatmodellezésben eloforduló leggyakoribb eloszlások paramétereinek becsléseit foglalja össze. Jelölje

σ2

α

az adott paramétert, α ˆ pedig a becslését. Ha eltávolítjuk a torzítást a

 a normális eloszlásnál és a b-étol  az egyenletes eloszlásnál, akkor ezek a becslésétol

becslések a mintaadatokon alapuló maximum likelihood becslések.  A valószínuségeloszlások  a valós világban eloforduló véletlenszeru  változásokat írják  le. Habár a változásokat véletlennek nevezzük, a véletlenszeruségnek  vannak különbözo  eloszlások megfelelnek annak, ahogyan a változások bekövetkezmértékei; a különbözo  eloszlásokat különbözo  szimulációs célokra használják. A valószínek. Ezért a különbözo nuségeloszlások  eloszlásfüggvényekkel vannak reprezentálva. Ezek megmutatják, hogy egy bizonyos érték mennyire valószínu.  A kumulatív eloszlásfüggvény annak a valószínuségét   vagy annál kisebb értéket választunk. Például, adja meg, hogy egy bizonyos értekkel egyezo,  az eloszlásból választva az ha a kumulatív eloszlásfüggvény az 1 értéknél 0.85, akkor ebbol esetek 85%-ában 1-nél kisebb számot kapunk. A kumulatív eloszlásfüggvény értéke egy  sur  adott pontban megegyezik a megfelelo  uségfüggvény-görbe  alatt a ponttól balra lévo  1-gyel, ezért a kumulatív elterülettel. Mivel a sur  uségfüggvény  alatti teljes terület egyenlo  oszlásfüggvény 1-hez tart, ahogyan a pozitív irányban haladunk elore. A modellezési esetek  többségében a modellezonek nem kell tudnia minden részletet ahhoz, hogy sikeresen felé pítsen egy szimulációs modellt. Elég azt tudnia, hogy melyik eloszlás a legmegfelelobb az adott esetre.  sur Most ismertetjük a leggyakoribb statisztikai eloszlásokat. A megfelelo  uségfügg vények ábrázolására a COMNET szimulációs modellezési eszközt használjuk. Gyakorlati  az összes elofordulás  szempontból egy sur  uségfüggvény  egy hisztogrammal közelítheto gyakoriságainak valószínuségekké  való konvertálásával.



Normális eloszlás. Tipikusan egy összetett folyamat eloszlásának modellezésére használható, ahol a folyamat komponens folyamatok összegeként írható le. Például, egy fájl  a fájlt felépíto  blokkok átviteli idejeinek az hálózaton való átvitelének ideje (válaszido)  eszközökben a normális eloszlás két pozitív vaösszegével egyezik meg. A modellezo lós számmal adható meg: a várható értékkel és a szórással. A függvényértékek szintén pozitív valós számok. Az x paraméter azt adja meg, hogy melyik véletlen számsoroza-

174

5. Hálózatok szimulációja

Normal(1, standard deviation, x) 2.00 1.80 std. dev. = 0.2

1.60 1.40 1.20 1.00 0.80 std. dev. = 0.4

0.60 0.40

std. dev. = 0.6

0.20 0.00 0.00

0.50

1.00

1.50

x

2.00

2.50

3.00

3.50

4.00

5.2. ábra. Normális eloszlás.

tot alkalmazzuk a mintakészítéshez. Ez az eloszlás szintén gyakran használt üzenetek méretének modellezésére. Például, egy üzenet leírható 20000 bájt átlagos mérettel és 5000 bájt szórással.



  fügPoisson-eloszlás. Ez az eloszlás az egy bizonyos idointervallumban bekövetkezo  getlen események elofordulásának számát modellezi. Például egy csomagfolyamból  egy cél által egy másodperc vagy perc alatt megkapott csomagok számát. A modellezo eszközökben a Poisson-eloszlás egy pozitív valós számmal, a várható értékkel adható meg. A

szám” paraméter az 5.3. ábrán azt adja meg, hogy melyik véletlen számsoro”  zat lesz alkalmazva a mintakészítéshez. Amikor ez az eloszlás egy idointervallummal együtt van megadva és egy egész számot ad, olyankor gyakran használják az adott inter beérkezések számának leírására. Szimulációkor viszont sokkal vallumban bekövetkezo  hasznosabb, ha ez az információ a beérkezések közötti idoközként van kifejezve. Erre a célra az exponenciális eloszlást használják.



 moExponenciális eloszlás. Ez az eloszlás a független események között eltelt idot dellezi, mint például a csomagfolyam egy forrása által küldött csomagok esetén a be érkezési idoközt. Fontos megjegyezni, hogy ha az események bekövetkezése közötti  exponenciális, akkor a bekövetkezett események száma Poisson-eloszlású. A moido  eszközökben az exponenciális eloszlás egy pozitív valós számmal, az eloszlás dellezo várható értékével, és egy x paraméterrel adható meg, ami pedig azt mondja meg, melyik véletlen számsorozatot alkalmazzuk a mintakészítéshez. Az eloszlás további alkalmazási területei még például: adatbázis tranzakciók, billentyu  leütések, fájl hozzáférések, elektronikus levelek, névfeloldási kérések, HTTP lekérdezések, X-window protokoll  modellezése. üzenetváltások stb. közötti idok



Egyenletes eloszlás. Az egyenletes eloszlás olyan adatokat modellez, melyek egy in valószínuséggel. tervallumból vesznek fel értékeket, mindegyiket egyenlo  Az eloszlás teljesen meghatározható a legkisebb és a legnagyobb lehetséges érték megadásával.  diszkrét egyenletes eloszlás is használható. A csoDiszkrét adatok esetén a megfelelo

175

5.5. A forgalom jellemzése

5.3. ábra. Poisson-eloszlás. Exponential(1, x) 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0

0.5

1

1.5

2

x

2.5

3

3.5

4

4.5

5

Exponential(main, stream)

5.4. ábra. Exponenciális eloszlás.

 eszközökben ez maghosszakat gyakran modellezik egyenletes eloszlással. A modellezo  ketto  a legkisebb és a az eloszlás három pozitív valós számmal adható meg. Az elso legnagyobb lehetséges értéket adja meg, a harmadik pedig azt, hogy melyik véletlen számsorozat legyen alkalmazva a mintakészítéshez.



 Pareto-eloszlás. A Pareto-eloszlás egy hatvány típusú eloszlás erosen ingadozó tulaj források modellezésére (nem hosszú távon függo  forgalomra). donsággal rendelkezo   három Az eloszlás erosen csúcsos, de a vége lassan csökken. Megadása a következo  paraméterrel történik: hely, alak és eltolás. A hely megadja ahol az eloszlás kezdodik, az alak meghatározza, hogy a vége milyen gyorsan ereszkedik, az eltolás pedig eltolja az eloszlást. A valószínuségeloszlások  egy közös alkalmazási célja az, hogy deniálják a hálózatok

 paramétereit. A hálózatok egy tipikus modellezési célú paramétere több üzenet különbözo  A megadott idon  egy üzenet indulásától a következo  üzeesetén az üzenetek közötti ido.  értjük. Ahogyan azt korábban tárgyaltuk, a beérkezési idoközökre  net indulásáig eltelt idot leggyakrabban használt eloszlás az exponenciális. Az exponenciális eloszlás számára megadandó paraméterek a várható érték és a véletlen folyamszám. A hálózati forgalmat gyakran írják le Poisson folyamatként. Ez általában azt jelenti, hogy az üzenetek számát gyelték

176

5. Hálózatok szimulációja

Uniform(3, 7, x) 0.25

0.2

0.15

0.1

0.05

0 1

0

2

3

x

4

5

6

7

8

5.5. ábra. Egyenletes eloszlás.

Pareto Distribution (offset=0)

1.6

location=1, shape=1.5

Pareto (location, shape, offset, x)

1.4

1.2

1 location=1, shape=0.95

0.8

0.6

0.4

0.2

location=5, shape=0.95

0 0

2

4

6

x

8

10

12

14

Pareto(location, shape, offset, stream) 5.6. ábra. Pareto-eloszlás.

 idointervallumokban,  meg egymást követo és a meggyelések száma egy intervallumban  eszközökben nem az idoegységenkénti  Poisson-eloszlású. A modellezo üzenetek számát

5.5. A forgalom jellemzése

177

 5.7. ábra. Exponenciális eloszlás átlagosan 10 másodperces beérkezési idoközzel.

 5.8. ábra. Az Exp(10.0) beérkezési idoköz sur  uségfüggvénye. 

 nem adják meg, hanem inkább az üzenetek beérkezési idoközét. Bebizonyítható, hogy ha   az egységnyi idointervallumonkénti üzenetszám Poisson-eloszlású, akkor a beérkezési ido köz exponenciális eloszlású. A 5.7. ábrán látható párbeszédablakban a beérkezési idoköz eloszlás COMNET-ben az Exp(10.0) kifejezéssel van deniálva. Ez azt jelenti, hogy az egy  üzenet indulása közötti ido  exponenciális eloszlást követ 10 üzenet és az utána következo  sur  uségfüggvényt  szemlélteti. másodperces átlaggal. A 5.8. ábra a megfelelo

178

5. Hálózatok szimulációja

5.9. ábra. Anomáliák a kerethosszakban.10-es ábra!!!

 forgalomfolyamok szimulációjára összpontoTöbb szimulációs modell is a különbözo  sít. A forgalomfolyamok szimulálhatók egyrészt a forgalom feltételezett jellemzoinek megadásával, vagy pedig a tanulmányozott alkalmazás muködése  során nyert valódi adatok fel alfejezetben fogjuk tárgyalni. használásával megalapozva. Ez utóbbit a következo  általában a hálózatról meglévo  adatok elemzésével kezdik a moA hálózatmodellezok  ol.  Ez segíti az alkalmazási szindellezést, hogy ezáltal képet kapjanak a hálózat jellemzoir  folyamatok elég mély megértését ahhoz, hogy az egyes hálózatelemeket a modelten lévo lezési konstrukciókhoz tudják rendelni. Különféle eszközök is használhatók a modellépítés    gyelmen kívül hagyhatja az olyan folyamaelott. Az elozetes elemzés után a modellezo tokat és eseményeket, amelyek nem fontosak a szóban forgó tanulmányban. Például, az adatbázis tranzakciókról nyert adatok a kerethossz nagy változékonyságát mutatják. Az 5.9. ábra segít elképzelni ezeket anomáliákat.  Ugyanezeknek az adatoknak a vizsgálata (19.1. ábra) a keretek beérkezési idoközeinek nagy változékonyságát is felfedi. A kumulatív valószínuségeloszlás-függvény  közelítésével például a kerethosszak hisz az eloszlástípus meghatározásában. togramja (5.11. ábra) segíti a modellezot

5.6. Szimulációs modellez® rendszerek 5.6.1. Adatgy¶jt® eszközök és hálózatelemz®k Ebben az alfejezet összefoglaljuk a szélesköruen  alkalmazott OPNET és COMNET  jellemzoit,  diszkrét-esemény szimulációs eszközök fo és az ezeket támogató hálózatelem  Környezetét. zoket, a Network Associates Sniffer-ét és a az OPNET Alkalmazásjellemzo Az OPNET ( Optimized Network Engineering Tools” – Optimalizált hálózattervezo  ” egy szélesköruen  alkalmazható szimulációs rendszer, mely alkalmas kommu-

eszközök)

nikációs hálózatok és elosztott rendszerek modellezésére részletes protokoll és teljesítmé-

5.6. Szimulációs modellezo  rendszerek

179

 5.10. ábra. A beérkezési idoközök nagy változékonysága. Az ábra színes változata megtalálható a 807. oldalon.

5.11. ábra. A kerethosszak hisztogramja. Az ábra színes változata a 807. oldalon látható.

nyelemzéssel. Az OPNET számos eszközt tartalmaz, melyek a modellezési és szimulációs  projektek egyes szakaszainak megfeleloen három kategóriába sorolhatók. Ezek a szakaszok  a következok: modellspecikáció, adatgyujtés  és szimuláció, valamint az elemzés.

180

5. Hálózatok szimulációja

5.6.2. Modellspecifikáció  a tanulmányozott hálózati rendszer egy reprezenA modellspecikáció során a modellezo tációját hozza létre. Az OPNET támogatja a modellek újrafelhasználását, azaz a modellek alapozhatók olyan beágyazott modellekre, melyeket korábban készítettek el és modell  szintu könyvtárakban tároltak. A specikációszerkesztokkel a modellek különbözo  rész az aktuális hálózati rendszer hierarchikus letezettséggel adhatók meg. Ezek a szerkesztok  struktúrájának megfeleloen osztályokba sorolják az modellezési információkat. A legmaga a Projektszerkeszto sabb szintu  szerkeszto,  alakítja ki a hálózati topológiák, alhálózatok, és  álló hálózatmodelleket, melyeket pedig a Csomópontszerkesztovel kapcsolatok modelljeibol   írja le a csomópontok belso  szerkezetét, funkcioadhatunk meg. A Csomópontszerkeszto  adatfolyamokat. A csomópontok olyan folyamatmodellnális elemeiket és a közöttük lévo modulokból állnak, melyeket a Folyamatszerkesztovel  adhatunk meg. A hálózat hierarchiájának legalacsonyabb szintjén a folyamatmodellek írják le az adott modul viselkedését a protokollokkal, algoritmusokkal és alkalmazásokkal kapcsolatban, véges automatákat és egy magasszintu  nyelvet felhasználva.  is elérheto  a folyamat- vagy csomópont-szintu Számos más szerkeszto  modellek által  adatmodellek deniálására, mint amilyenek például a csomagformáhivatkozott különbözo   tumok és a folyamatok közötti vezérloinformációk. További szerkesztokkel készíthetünk,  sur módosíthatunk vagy csak megtekinthetünk különbözo  uségfüggvényeket,  melyekkel kü eseményeket irányíthatunk. Ilyen például a csomagok küldése vagy fogadása kölönbözo  meghatározása. A modellspecikáció-szerkesztok  egy grakus felületet bizzött eltelt ido tosítanak a felhasználónak, mellyel változtathatja a modelleket ábrázoló objektumokat és a  folyamatokat. Mindegyik szerkeszto  a modell egy adott absztrakciós szintjének megfelelo  objektumokat és muveleteket  adja meg megfelelo  adhatja meg. Ezért a Projektszerkeszto  a processzorokat, sorokat a hálózat csomópontjait és kapcsolatait, a Csomópontszerkeszto  adó és fogadó egységeket, a Folyamatszerkeszto  pedig a és a hálózat csomópontjaiban lévo  absztrakciós szintjeit folyamatok állapotait és átmeneteit. A 5.12. ábra az egyes szerkesztok szemlélteti.

5.6.3. Adatgy¶jtés és szimuláció  Az OPNET a szimuláció alatt többféle kimenetet tud készíteni attól függoen, hogy a model ezt hogyan deniálja. A modellezok  legtöbb esetben beépített adattípusokat is használlezo hatnak: kimenetvektorokat és skalárokat, valamint animációkat.



 A kimenetvektorok idosorozatok szimulációs adatait reprezentálják. Ezek a vektorok   értéke ido-érték párokat tartalmazó bejegyzések listájából állnak. A bejegyzések elso  a független, a második pedig a függo  változónak. tekintheto



A skaláris statisztikák a szimuláció alatt gyujtött  statisztikákból származtatott egyedi értékek. Ilyen például az átlagos átviteli ráta, az eldobott cellák számának maximuma,  és más egyéb statisztikák. az átlagos válaszido



 animációkat is tud készíteni. Az OPNET a szimuláció alatt vagy az után megtekintheto  deniálhat többféle animációt is, például csomagfolyamokat, állapotátmeA modellezo neteket és statisztikákat.

5.6. Szimulációs modellezo  rendszerek

181

 adják meg. 5.12. ábra. A három absztrakciós szintet a Projekt-, Csomópont- és Folyamatszerkesztok

5.6.4. Elemzés A szimuláció alatt összegyujtött  adatok többsége kimenetvektor és skalár állományokban tárolódik. Ezeknek az adatoknak az elemzésére az OPNET egy Elemzoeszköz  nevu  segédeszközt nyújt, amely ábrázoló és numerikus feldolgozó-funkciók gyujteménye.  Az Elem zoeszköz az adatokat grakonok és nyomkövetések formájában jeleníti meg. A nyomkövetések az X és Y tengelyek értékpárjainak listáját tartalmazzák. Tárolásukra és megjeleníté  sükre elemzotáblákat használ. Az Elemzoeszköz a szimulációs eredmények feldolgozására és új nyomkövetések készítésére módszerek széles választékát támogatja. Ebben benne van a hisztogramok, sur  uség  és kumulatív eloszlásfüggvények, valamint a kondencia interval használatát is a vektor vagy lumok számítása is. Támogatja továbbá a matematikai szur  ok  elore  nyomkövetési adatok feldolgozásához. A matematikai szur  ok deniált számításokra, valamint statisztikai és aritmetikai operátorokra alapozott hierarchikus blokkdiagrammok  két ábra (5.13. és 5.14.) az Elemzoeszköz által készített ként vannak deniálva. A következo grakonokat szemlélteti.  A 5.14. ábrán látható Elemzoeszköz négy grakont jelenít meg egyszerre. Népszeru  diszkrét-esemény szimulációs rendszer a COMNET is, melyet majd a 5.9. alfejezetben fogunk röviden tárgyalni.

182

5. Hálózatok szimulációja

 grakon) valamint vektor adatok (alsó grakon) grakus megjelení5.13. ábra. Egy példa a skaláris adatok (felso tésére.

5.6.5. Hálózatelemz®k  az Alkalmazásjellemz® Kör0nyezet   az Egyre nagyobb az érdeklodés az alkalmazás életciklusán keresztüli, a fejlesztéstol  üzembe helyezésig tartó teljesítmény-elorejelzésre, mérésre, modellezésre és megállapí tásra. Az alkalmazások teljesítményének elorejelzése különösen fontos olyan alkalmazási  területeken, mint amilyen például az elektronikus kereskedelem. Az egyre inkább versengo elektronikus kereskedelemnél az alkalmazás teljesítménye különösen fontos lehet ott, ahol nagyon szoros a verseny. A teljesítmény így a bevételekre is hatással van. Ha egy alkalmazás gyengén teljesít, akkor az alkalmazás helyett inkább mindig a hálózatot hibáztatják. Ezeket a teljesítményproblémákat sokminden okozhatja, például az alkalmazás tervezési hibája vagy a lassú adatbázisszerverek. Az Alkalmazásjellemzo  környezethez ( Application ” Characterization Environment” – ACE) és a Network Associates Sniffer-jéhez hasonló esz módszertanokat fejleszthetnek ki arra, hogy azonosítani közök használatával a modellezok   problémákat. tudják az alkalmazás-lelassulások forrását és megoldják az azokat eloidéz o  javaslatokat tehetnek a teljesítmény optimalizáAz alkalmazás elemzése után a modellezok  lehetnek. lására, aminek eredményei gyorsabb alkalmazások és jobb válaszidok  környezet a hálózati alkalmazások szemléltetésére, elemzésére Az Alkalmazásjellemzo  és alkalmazásfejlesztoi  a és hibáinak elhárítására alkalmas eszköz. A hálózatok szervezoi  következokre használhatják.



Hálózatok és alkalmazások szuk  keresztmetszetének meghatározására.



Hálózati és alkalmazásproblémák felderítésére.

5.6. Szimulációs modellezo  rendszerek

183

 Elemzoeszköz.  5.14. ábra. Négy grakont megjeleníto



 alkalmazások válaszidejeire gyakorolt haVárható hálózati módosításoknak a meglévo tásának elemzésére.



Az alkalmazásoknak változó kongurációk és hálózati feltételek melletti teljesítményé nek elorejelzésére.

 határozzák meg, melyeket különbözo  Egy alkalmazás teljesítményét a hálózat jellemzoi  lista néhány ilyen tulajdonságot és a kapcsolódó komponensek befolyásolnak. A következo hálózatelemeket tartalmazza:



Hálózati közeg –

 ingadozás) Sávszélesség (torlódás, eros

–

 alkalmazások) Késleltetés (TCP ablakméret, nagy késleltetésu  eszközök, csevego



Csomópontok



Kliensek



–

 A felhasználók számára szükséges ido

–

 Feldolgozási ido

–

Kiéheztetés

Kiszolgálók

184



5. Hálózatok szimulációja

–

 Feldolgozási ido

–

Többrétegu  várakozó adatok

–

Kiéheztetés

Alkalmazások –

 alkalmazások) Alkalmazás-fordulók (túl sok forduló – csevego

–

Szálak (egy és többszálúság)

–

 Adat prol (erosen ingadozó, túl sok adatfeldolgozás)

Az alkalmazások elemzése két fázist igényel:



Az alkalmazás futása közben csomag-nyomkövetések készítése ahhoz, hogy egy alapkongurációs modellt készíthessünk az alkalmazás modellezéséhez. Ehhez használhat eszközeit. Ezek a nyomkövetések strajuk az ACE vagy bármely más hálózatelemzok  el. tégiailag telepített ügynök-alkalmazásokkal készíthetok



A nyomkövetés-állomány importálásával az alkalmazás tranzakcióinak ábrázolása, amit alkalmazásfeladatnak nevezünk, az alkalmazás által generált üzenetek és protokoll adategységek további elemzése céljára.  muveleteket Az alkalmazásfeladat elkészítése után a következo  végezhetjük el a forga-

lom nyomkövetési eredményein:



A csomag-nyomkövetés eredményeinek megjelenítése és szerkesztése a protokoll szintjein, külön ablakokban. Ezeket az ablakokat arra is használverem különbözo  részeit. Így a hatjuk, hogy eltávolítsuk vagy töröljük az alkalmazásfeladat különbözo  tranzakciókra tudjuk fordítani a legnagyobb gyelmet. minket érdeklo



Alkalmazási szintbeli elemzés elvégzése a szuk  keresztmetszetek felismerésére. Külön  egyes összetevoit,  megmérhetjük a válaszido mint például az alkalmazási szinten eltöl a feldolgozási idot  és a hálózati adattovábbítás idejét, továbbá részletes statisztött idot, tikákat tekinthetünk meg a hálózatról és az alkalmazásról. A csomag-nyomkövetések eredményei alapján elemezhetjük a hálózati és alkalmazásprotokollok adategységeit is.



  módosítási ötletek és tervezett Az alkalmazás teljesítményének elorejelzése különbözo változtatások esetén.  A következokben a részletekbe bocsátkozás nélkül illusztráljuk egy egyszeru  három-

  rétegu  alkalmazáson keresztül az elobb említettek jellemzoit. Egy távoli alkalmazásszer kliens (ami adatbázis szervertol  igényel információkat) esetén szeretnénk verhez hozzáféro  okait. A kliens egy ADSL vonalon csatlakozik az Intermeghatározni a nagy válaszido netre, az alkalmazásszerver és az adatbázis szerver között pedig egy 100 Mbps sebességu   okát, valamint megoldási leEthernet kapcsolat van. Azonosítani akarjuk a nagy válaszido  hetoségeket szeretnénk ajánlani. Ehhez nyomkövetési ügynököket telepítünk a kliens és az alkalmazásszerver valamint a két szerver közé. Az ügynökök egyidejuleg  mindkét helyen gyujtik  az információkat a tranzakciók alatt. Ezután a nyomkövetési információk egyesíthe és szinkronizálhatók, hogy ezáltal a hálózat és az egyes rétegek késleltetésének a leheto  tok  legjobb elemzési lehetoségét tudják nyújtani. A nyomkövetési információknak az ACE-ba való importálása után a tranzakciókat az Adatcsere diagramon ( Data Exchange Chart”) elemezzük, ami ábrázolja az alkalmazás ” üzeneteinek a rétegek közötti továbbítását (lásd a 19.4. ábrát).

5.6. Szimulációs modellezo  rendszerek

185

5.15. ábra. Adatcsere diagram. Az ábra színes változata megtalálható a 808. oldalon.

 méAz Adatcsere diagram megmutatja a kliens és a szerverek között átvitt különbözo  Függoségek ”  megjelenítése” jelölonégyzet bejelölése esetén fehér vonalak jelzik a nagy feldolgozási kés-

retu  csomagokat. A tranzakció teljes válaszideje körülbelül 6 másodperc. A

leltetéseket az alkalmazásszerver és a kliens rétegeknél. További elemzés céljára készíttethetünk egy

Késleltetések összegzése” ablakot, melyben az alkalmazás válaszideje a követ”  négy általános kategóriára van osztva: az alkalmazás késleltetése, terjedési késleltekezo tés, átviteli késleltetés és protokoll/torlódás miatti késleltetés (lásd az 5.17. ábrát). Ennek a diagramnak a segítségével meggyelhetjük az alkalmazáshoz és a hálózathoz kapcsolódó késleltetések viszonyát a kliens és a szerverek közötti tranzakció alatt. Látható, hogy az alkalmazás késleltetése jóval több, mint a terjedési, átviteli és a protokoll/torlódás miatti késleltetés. A Diagnózis” funkció (5.17. ábra) a lehetséges szuk  keresztmetszeteknek egy sokkal ”   elemzésével, melyek gyakran részletesebb elemzési lehetoségét biztosítja olyan tényezok okoznak teljesítményproblémákat a hálózati alkalmazásokban. Az egy adott küszöb feletti értékek szuk  keresztmetszetként, vagy lehetséges szuk  keresztmetszetként vannak megjelölve.  A tranzakció diagnózisa igazolja, hogy az elsodleges szuk  keresztmetszet az alkalmazásszerver feldolgozási késleltetése miatt van. A feldolgozási késleltetést lassú állomány input/output, CPU feldolgozás vagy memóriahozzáférés okozhatja. Az elemzés egy má sik szuk  keresztmetszetet is felfed, ami az alkalmazás csevegossége. Ez tehát a követ feladatunk. Az alkalmazás viselkedését az alkalmazás-fordulókkal kapcsolatban vizskezo gáljuk, amihez a tranzakció-statisztikákból juthatunk hozzá. Egy alkalmazás-forduló az alkalmazás-üzenetfolyam irányának megváltozását jelenti. A tranzakció statisztikáiból (5.18. ábra) kiderül, hogy az alkalmazás-fordulók száma   alkalnagy, azaz a tranzakció által egy idoben küldött adatok mérete kicsi. Ez jelentos

186

5. Hálózatok szimulációja

5.16. ábra. Késleltetések összegzése. Az ábra színes változata a 808. oldalon látható.

5.17. ábra. Diagnózis ablak.

mazásbeli és hálózati késleltetéseket okozhat. Továbbá, az alkalmazás feldolgozási idejé része telhet el a sok kérés és válasz feldolgozásával. A Diagnózis ablak egy nek jelentos   Csevegosség” szuk  keresztmetszetet jelez Csevegosség hálózati költsége” szuk  kereszt” ”  metszet nélkül, ami a következoket jelenti:

5.6. Szimulációs modellezo  rendszerek

187

5.18. ábra. Statisztikák ablak.



 hálózati forgalmat a csevegosség  Az alkalmazás nem generál jelentos miatt.



 feldolgozási késleltetést okoz a sok kis alkalmazási szintbeli Az alkalmazás jelentos kérés és válasz kezelése miatt.



  Csevegosség hálózati költsége” drasztikusan nohet egy nagyobb kés” leltetésu  hálózatban.

Az alkalmazás

Azt lehet ajánlani, hogy az alkalmazásnak kevesebb és nagyobb üzeneteket kellene kül denie. Ezzel hatékonyabban használná ki a rétegek és a hálózat eroforrásait. Például, egy adatbázis alkalmazásnak nem szabad egy rekordhalmazt rekordonként egyesével elküldenie.   akkor, ha nagyobb sávszélességet adnánk (??. Vajon jelentosen csökkenne-e a válaszido ábra) a kliens és az alkalmazásszerver közötti kapcsolathoz? Ennek a kérdésnek a megválaszolása azért fontos, mert a nagyobb sávszélesség sokba kerül. A becslés funkciót fel diagramon a sávszélességet 128 használva megválaszolhatjuk ezt a kérdést. A következo  jaKbps-ról 10 Mbps-ra növeltük. Látható, hogy körülbelül 827 Kbps után nincs jelentos  vulás a válaszidoben, azaz az ajánlott legnagyobb sávszélesség ennél az alkalmazásnál nem nagyobb, mint 827 Kbps, ami pedig biztosítható egy nagyobb sebességu  DSL vonallal is. Az alkalmazás teljesítményének elemzése után a forgalom nyomkövetési adataiból azonnal el tudjuk készíteni az induló alapkongurációs modellt további szimulációs célokra, amit a 5.20. ábra szemléltet.

188

5. Hálózatok szimulációja

 5.19. ábra. A sávszélesség hozzáadásának hatása a válaszidore. Az ábra színes változata a 809. oldalon látható.

5.20. ábra. Alapkongurációs modell további szimulációs tanulmányokra.

5.6.6. Sniffer  a Network Associates cég Sniffer nevu Egy másik népszeru  hálózatelemzo  terméke. (A Net work Associates ezt nemrég nevezte át Netasyst-re.) Ez egy hatékony hálózatmegjeleníto  feladatok megoldását teszi lehetové:  eszköz, ami a következo



 nyomkövetését. A hálózati forgalom részletes elemzés céljára történo

5.7. Modellfejlesztési életciklus



189

Az



Expert Analyzer” segítségével problémák diagnosztizálását. ” A hálózati tevékenységek valós ideju  meggyelését.



Részletes kihasználtság és hibastatisztikák gyujtését  az egyes állomásokról, párbeszé vagy a hálózat bármely részérol.  dekrol



A korábbi kihasználtság és hibainformációk mentését alapkongurációs elemzésre.



Látható és hallható riasztások létrehozását, továbbá a hálózat adminisztrátorainak értesítését problémák észlelése esetén.



 A hálózat aktív eszközökkel való vizsgálatát forgalomszimulációs célokra, válaszido mérésre, hop-ok számlálására és problémák elhárítására.

5.7. Modellfejlesztési életciklus 5.7.1. Egy keretrendszer hálózatmodellez®k számára A hálózatmodellezésnek számos megközelítése van. Egy lehetséges módszer egy modell készítése a hálózati topológia alapján a hálózati forgalom statisztikai közelítésével. Néhány  meg tudja vizsgálni néhány paraméter változtatásának a hálózat módosítás után a modellezo vagy az alkalmazás teljesítményére gyakorolt hatását. Ennél a megközelítésnél fontosabb a teljesítménykülönbségek vizsgálata annál, hogy egy olyan modellt használjunk, ami valós hálózati forgalmon alapszik. Például, bizonyos kliens-szerver tranzakciókat feltételezve  változását a kapcsolat-kihasználtság függvényében. Ebben meg akarjuk mérni a válaszido az esetben nem különösebben fontos, hogy egy a valódi hálózati forgalmon alapuló mo által becsült adatdellt alkalmazzunk. Elég megadni egy gyakori felhasználó vagy tervezo  forgalom mennyiségét, majd ezen adatmennyiség esetén vizsgáljuk meg, hogy a válaszido  amikor a kapcsolat-kihasználtság növekszik az eredetihez képest. mennyivel no,  o  hálózatszerveA hálózatmodellezés leggyakrabban használt megközelítése a megeloz zés módszertanát követi. Ez magában foglalja az valós hálózati forgalmon alapuló hálózati  modell készítését a hálózat jelenlegi és a jövobeni viselkedésének szimulálására és az új   és szimulációs eszköalkalmazások hozzáadásának hatásainak elorejelzésére. A modellezo  változtatni tudnak a modellen, új berendezéséket, zök alkalmazásával a hálózatszervezok munkaállomásokat, kiszolgálókat és alkalmazásokat adhatnak hozzá. Ezen kívül az egyes  kapcsolatokat nagyobb sebességuekre  cserélhetik, és tesztelhetik oket a hálózat tényleges   megváltoztatása elott. A következokben ezt az egyetemek, vállalatok és az ipar által szé bekezdésekben a modelllesköruen  elfogadott megközelítési módot követjük. A következo fejlesztési életciklusnak nevezett modellezési lépéseket tekintjük át, amelyeket már több nagyméretu  vállalati hálózat modellezésében alkalmaztunk. A modellfejlesztési életciklus  lépésekbol  áll: tehát a következo



A hálózat topológiájának és komponenseinek azonosítása.



Adatgyujtés. 



Az alapkongurációs modell elkészítése és érvényesítése, és ennek felhasználásával szimulációs tanulmányok végzése.



Az alkalmazásmodell elkészítése az alkalmazások által generált forgalom részleteinek felhasználásával.

190 •

5. Hálózatok szimulációja

Az alapkongurációs és az alkalmazásmodell integrációja valamint a szimulációs tanulmányok befejezése.



További adatgyujtés  a hálózat növekedése és változásai után, továbbá miután további részleteket tudtunk meg az alkalmazásokról.



Ezeknek a lépéseknek a megismétlése.  A következokben a fenti lépéseket részletezzük:

A hálózat topológiájának és komponenseinek azonosítása A topológia a hálózat zikai komponenseit (forgalomirányítók, áramkörök és kiszolgálók) és ezek kapcsolatát írja le. Tartalmazza az egyes hálózati berendezések helyét és kongurációjuk leírását, azt hogy milyen típusú és sebességu  áramkörökkel vannak összekapcsolva, a LAN-ok és WAN-ok típusát, a kiszolgálók helyét, a címzési módokat, az alkalmazások és protokollok listáját stb. Adatgyujtés  Az alapkongurációs modell felépítéséhez szükség van a topológia és forgalom adataira.  a topológia jellemzoit  A modellezok megadhatják manuálisan, vagy pedig hálózatmene eszközök és a hálózati berendezések kongurációs állományainak felhasználásával. dzselo  eszköz használja az Egyszeru Számos hálózatmenedzselo  hálózati menedzsment protokollt ( Simple Network Management Protocol” – SNMP), mellyel a forgalomirányítókban és ” más berendezésekben futó SNMP ügynökök által karbantartott Menedzsment információs adatbázisból ( Management Information Base” – MIB) lehet lekérdezni. Ezt a folyamatot ” nevezik SNMP hálózat-feltérképezésnek. A kérdéses hálózat topológiájának felméréséhez topológia-adatokat importálhatunk a forgalomirányítók kongurációs állományaiból. Egyes  eszközök hálózatmenedzsment platformok (például HP OpenView teljesítménymenedzselo vagy IBM NetView) térkép állományaiból is tudnak adatokat importálni. Ezek exportálási funkcióját alkalmazva a kapott térkép fájl importálható lesz a modellezéshez.  forrásokból Az alapkongurációs modellhez szükséges forgalmi adatok különbözo származhatnak: interjúkból és hálózati dokumentumokból származó forgalomleírásokból,  és hálózatetervezési vagy karbantartási dokumentumokból, MIB/SNMP jelentésekbol  vagy Távoli meggyelo lemzo  ( Remote Monitoring” – RMON) nyomkövetési eredmé”  Az RMON egy hálózatmenedzselo  protokoll, ami lehetové  nyekbol. teszi a hálózati információk gyujtését  az egyes csomópontokban. Az RMON nyomkövetési eredményeit RMON   szintjein szondák gyujtik,  melyek szabványuktól függoen a hálózati architektúra különbözo gyujtik  az adatokat. A 5.21. ábra a leggyakrabban használt szabványokat és adatgyujtési  szinteket foglalja össze. A hálózati forgalom osztályozható használat és alkalmazás alapú adatokként. A legfontosabb különbség a két osztály között az, hogy milyen fokú részleteket biztosítanak az  adatok, valamint hogy milyen következtetések vonhatók le belolük. A felosztás egyértelmuen  megadható két egymás melletti OSI réteg, a szállítási és a viszonyréteg segítségével. A használat alapú adatok a szállítási réteggel kapcsolatos teljesítménykérdésekkel kapcsolatos vizsgálatokra szolgálnak, az alkalmazás alapú adatok pedig a hálózati architektúra szállítási rétege fölötti rétegekkel kapcsolatos elemzésekre. (Intenet terminológiában ez ekvivalens a TCP szint és az e fölötti alkalmazási szint közötti vágással.)

191

5.7. Modellfejlesztési életciklus

RMON1

RMON2

Ethernet/Token Ring

X

X

Enterprise RMON X

MAC réteg meggyelése

X

X

X

hálózati réteg meggyelése

X

X

alkalmazási réteg meggyelése

X

X

kapcsolt LAN, Frame Relay, ATM

X

VLAN támogatása

X

alkalmazás válaszideje

X

5.21. ábra. Az RMON szabványok összehasonlítása.

A használat alapú adatok gyujtésének  célja a teljes forgalom méretének meghatározása  megvalósítása elott.  az alkalmazásoknak a hálózaton történo Ezek az adatok a forgalomirá SNMP ügynököktol  gyujthet  össze. nyítókban vagy egyéb hálózati berendezésekben lévo  ok A forgalomirányítókhoz vagy kapcsolókhoz küldött SNMP kérdések statisztikákat biztosítanak az egyes LAN interfészeken, WAN áramkörökön vagy permanens virtuális áramkör ( Permanent Virtual Circuit” – PVC) interfészeken keresztül küldött bájtok pontos számᔠ sávszélesség ról. Ezen adatok segítségével kiszámíthatjuk az egyes áramkörökön elérheto kihasználtságát. Az alkalmazás alapú adatok gyujtésének  célja pedig az egy alkalmazás által generált adatok mennyiségének és az alkalmazás igényeinek a típusának meghatározása. Ez lehe  számára az alkalmazás viselkedésének megértését és az alkalmazási tové teszi a modellezok   RMON2 kompatibilis szondákból, a szintbeli forgalom jellemzését. A forgalomelemzokb ol,  vagy a NETScout Manager-bol  származó adatok különbözo  részleteket biztosítaSniffer-bol  berendezések nak az alkalmazás hálózati forgalmáról. A stratégiailag elhelyezett adatgyujt  o elég adatot tudnak gyujteni  ahhoz, hogy világosan lássuk az alkalmazás forgalmának visel tipikusan a következo  alkalmazási szintbeli adatokat gyujtik: kedését. A forgalomelemzok 



Az alkalmazások típusait.



 hosztokat. A hálózati rétegbeli címmel (azaz IP címmel) rendelkezo



 Két hoszt közötti hálózati párbeszédek hosszát (a kezdés és a befejezés idopontja).



Az egyes párbeszédek során mindkét irányban az elküldött bájtok számát.



A párbeszédek során mindkét irányban a csomagok átlagos méretét.



 ingadozását. A forgalom eros



Csomaghossz eloszlásokat.



 Csomag-beérkezési idoköz eloszlásokat.



Csomagtovábbítási protokollokat.



 Forgalom prolt, azaz üzenet és csomag méreteket, beérkezési idoközöket és feldolgozási késleltetést.



Egy alkalmazásnak egy tipikus felhasználó általi használatának gyakoriságát.



 csomópontok fontosabb kölcsönhatásait, események sorozatait. A résztvevo

192

5. Hálózatok szimulációja

Az alapkongurációs modell elkészítése és érvényesítése, és ennek felhasználásával szimulációs tanulmányok végzése Az alapkongurációs modell készítésének célja az, hogy a vizsgált hálózat pontos modelljét adjuk meg. Ez a modell a hálózat jelenlegi állapotát tükrözi. A tanulmányok pedig az ezen  a modellen elvégzett módosítások hatásait mérik fel. A modell könnyen érvényesítheto,  ugyanis az elorejelzéseinek összhangban kell lenniük az aktuális hálózaton végzett méré teljesítmény-mértékeket sekkel. Az alapkongurációs modell általában csak olyan alapveto  mint az eroforrás   jelez elo, kihasználtság és a válaszido. Az alapkongurációs modell a topológiának és a korábban összegyujtött  használat alapú forgalomadatoknak az egyesítésével jön létre. Ezt érvényesíteni kell az aktuális hálózat teljesítmény-paramétereivel, azaz igazolni kell, hogy a modell a valós hálózati mu ködéshez hasonlóan muködik.  Az alapkongurációs modell használható az aktuális hálózat  elemzésére, és szolgálhat a további alkalmazás és kapacitástervek alapjául is. A modellezo az életciklus adateszközök importálási funkcióját alkalmazva a modellkészítés kezdheto  hálózatmegyujtési  lépésében összegyujtött  topológiaadatok importálásával. A különbözo  rendszerek, mint például a HP OpenView vagy a Network Associate Sniffer-je, a nedzselo topológia adatait általában topológia-állományokban (.top vagy .csv) tárolják. A forgaloma datokat tartalmazó állományok a következoképpen csoportosíthatók:



 Párbeszédek résztvevoinek kommunikációjával kapcsolatos állományok, melyek összegyujtve  tartalmazzák a hálózat terheltségének információit, a hosztneveket, a küldött  csomagok és bájtok számát az egyes hosztpárok esetén. Az adatok lehetové teszik a   modellezoeszköz számára, hogy megtartsa a forgalom erosen ingadozó voltát. Ezek az  adatgyujt  eszközök segítségével nyerhetok.  állományok különbözo  o



Esemény-nyomkövetési állományok, melyek összegzett információk helyett az egyes  tartalmaznak információkat. A szipárbeszédekhez kapcsolódó hálózatterheltségérol  eseményre lejátszhatók a hálózati tevémuláció során az állomány alapján eseményrol kenységek.  a modellezonek   szimulációs paraméterekkel kapcsolatA szimuláció elott a következo

ban kell döntenie:



Futási ido.  A futási idonek  nagyobbnak kell lennie, mint a leghosszabb üzenetnek a  alatt a szimulációnak elegendo  számú eseményt kell hálózatban való késése. Ezen ido  létrehoznia, hogy a modell elég mintát tudjon generálni minden eseménybol.



 ami a csoFelmelegedési periódus. A szimuláció felmelegedési periódusa az az ido,  egyéb elemeinek inimagok, pufferek, üzenetsorok, áramkörök és a modell különbözo cializálásához kell. A felmelegedési periódus megegyezik egy tipikus üzenet hosztok közötti késleltetésével. A szimuláció felmelegedési ideje azért szükséges, hogy bizto sítsuk az egyensúlyi állapot elérését az adatgyujtés  megkezdése elott.



Többszöri ismétlések. Olyan esetekben, amikor a statisztikák nem eléggé közelítik a valós értékeket, szükség lehet egy adott modell többszöri lefuttatára is. Szintén több szöri ismétlésekre van szükség az érvényesítés elott, amikor több másolatot futtatunk le azért, hogy meghatározzuk a statisztikáknak a másolatok közötti ingadozását. Ennek okai leggyakrabban a ritka események.



Kondenciaintervallum.

A

kondenciaintervallum

segítségével

becsüljük

meg

a

 méretét. Ez megad egy becsült értéktartományt, populáció-paraméter valószínusíthet  o

5.7. Modellfejlesztési életciklus

193

ami egy adott valószínuséggel  tartalmazza a becsült paramétert. A leggyakrabban használt intervallumok a 95% és 99% kondenciaintervallumok, melyek 0.95 és 0.99 valószínuséggel  tartalmazzák az adott paramétert. A szimulációban a kondenciaintervallum egy mutatót biztosít a szimulációs eredmények pontosságára nézve. A kevesebb ismétlés szélesebb kondenciaintervallumot és kisebb pontosságot eredményez.  Több modellezoeszközben a topológia és forgalomadatokat tartalmazó állományok im portálása után az alapkongurációs modell automatikusan elkészül. Ezt ellenorizni kell a  lépések végrehajtásákonstrukciós hibák elkerülése végett, majd érvényesíteni a következo val:



  Egy elozetes futtatással ellenorizni kell, hogy minden forrás-cél pár jelen van-e a modellben.



Egy felmelegedési periódust is tartalmazó hosszabb szimulációval meg kell mérni a küldött és fogadott üzenetek számát és a kapcsolatok kihasználtságát, hogy ezzel igazoljuk  méretu a megfelelo  forgalommennyiség átvitelét. Az alapkongurációs modell érvényesítése igazolja, hogy a szimuláció ugyanazokat a

teljesítmény-paramétereket szolgáltatja, mint amiket a zikai hálózaton mértünk. Általában  hálózatjellemzok  mérhetok  mind a modellben, mind pedig a zikai hálózatban. a következo



Küldött és fogadott csomagok száma.



Pufferhasználat.



Csomagkésleltetés.



Kapcsolat-kihasználtság.



Csomópontok CPU kihasználtsága. A kondenciaintervallumok és az egymástól független minták száma befolyásolja azt,

hogy modell és a valós hálózat között milyen szoros egyezés várható. A legtöbb esetben a  legjobb, amit várhatunk, egy átfedés a szimulációval elorejelzett értékek és a mért adatok kondenciaintervalluma között. A nagyon szoros egyezés elérése túl sok mintát igényelne a hálózatból, és a szimuláció túl sokszori ismétlését. Az alkalmazásmodell elkészítése az alkalmazások által generált forgalom részleteinek felhasználásával Az alkalmazásmodelleket akkor tanulmányozzák, ha egy hálózati alkalmazásnak a hálózat teljesítményére gyakorolt hatását, vagy pedig ha a hálózatnak az alkalmazás teljesítményére gyakorolt hatását kell kiértékelni. Az alkalmazásmodellek a hálózati csomópontok között az alkalmazás futása alatt generált forgalomról szolgáltatnak részleteket. Az alkalmazásmodellek építésének lépései hasonlóak az alapkongurációs modellnél tárgyaltakhoz:



 és a felhasználói prolokról. Adatok gyujtése  az alkalmazás eseményeirol



Az alkalmazás adatainak importálása a szimulációs modellbe manuálisan vagy automatikusan.



A modellezési hibák azonosítása és javítása.



A modell érvényesítése.

194

5. Hálózatok szimulációja

Az alapkongurációs és az alkalmazási modell integrációja és a szimulációs tanulmányok befejezése  lépések Az alkalmazásmodell(ek) és az alapkongurációs modell integrációja a következo szerint történik:



Kezdjük a használat alapú adatokból készített alapkongurációs modellel.



Az alkalmazáshasználati esetek információit felhasználva (a felhasználók helye, száma, tranzakciók gyakorisága) meghatározzuk, hogy hová és hogyan töltsük be az alkalmazásprolokat az alapkongurációs modellbe.



 o  lépésben generált alkalmazásprolokat az alapkongurációs modellhez adjuk, Az eloz melyek a tanulmányozott alkalmazás által generált forgalmat ábrázolják.  lépésekbol  áll: A szimulációs tanulmányok befejezése a következo



Futtassuk a modellt vagy szimulációt egy modellezési eszköz felhasználásával.



Elemezzük az eredményeket: hasonlítsuk össze a cél tranzakciók teljesítmény paramétereit a szimuláció kezdetekor felállított célokkal.



 hálózatelemek kihasználtságát és teljesítményét, különösen ott Elemezzük a különbözo ahol a célokat nem értük el.  eseteket tartalmazzák: A tipikus szimulációs tanulmányok a következo



Kapacitáselemzés A kapacitás elemzésekor a hálózat paramétereinek változásait tanulmányozzuk, mint például: –

Felhasználók számának és helyének változása.

–

Hálózatelemek kapacitásának változása.

–

Hálózati technológiák változása.

 érdekelhetik például a különbözo  változtatásoknak a következo  hálózatA modellezot paraméterekre gyakorolt hatásai:



–

Kapcsolók és forgalomirányítók kihasználtsága.

–

Kommunikációs kapcsolatok kihasználtsága.

–

Pufferkihasználtság.

–

Az újraküldött és az elveszett csomagok száma.

 elemzése Válaszido  elemzésének köre az üzenet és csomagtovábbítási késleltetések tanulmáA válaszido nyozása: –

Alkalmazási és hálózati rétegbeli csomagtovábbítási késleltetés.

–

 Csomag válaszido.

–

Üzenet/csomag késleltetések.

–

Az alkalmazás válaszideje.

5.8. A forgalom ingadozásának hatása nagy sebességu  hálózatokra



195

Alkalmazáselemzés  arányának megEgy alkalmazással kapcsolatos tanulmányhoz az alkalmazás válaszido határozása tartozik, relatívan az egyes hálózati komponensek és alkalmazások késleltetéséhez. Az alkalmazások elemzése statisztikákat biztosít a hálózat és az alkalmazások  teljesítményjellemzoir  ol,  beleértve az eloz  o  alfejezetben tárgyaltakat is. különbözo

További adatgyujtés  a hálózat növekedése és változásai után, továbbá miután további részleteket tudtunk meg az alkalmazásokról   A következokben bemutatott fázisnak a célja az, hogy elemezze vagy elorejelezze a hálózat teljesítményét az aktuális feltételek és a hálózat terhelésének megváltozása (új alkalmazások, felhasználók vagy hálózati struktúra) esetén:



Azonosítsuk a hálózati infrastruktúra azon módosításait, melyek megváltoztatják a há lózati eroforrások kapacitásigényét.



Az áttervezés tartalmazhatja a megnövekedett vagy lecsökkent kapacitást, a hálózatelemek áthelyezését vagy a megváltozott kommunikációs technológiát.



 Módosítsuk a modellt ezeknek a változásoknak megfeleloen.



Mérjük fel az alkalmazás fejlesztési vagy telepítési terveknek a hálózatra gyakorolt hatását.



Mérjük fel az üzleti feltételek és tervek (pl. új felhasználók, telephelyek hozzáadása) hatását a hálózatra.



Használjunk folyamatos mérési technikákat a használati tendenciák, különösen az Internet és intranet használathoz kapcsolódók gyelésére.

5.8. A forgalom ingadozásának hatása nagy sebesség¶ hálózatokra 5.8.1. Bevezetés A helyi hálózati és nagy kiterjedésu  hálózati forgalommal kapcsolatos jelenlegi mérések azt bizonyítják, hogy a szélesköruen  elterjedt Markov-folyamat modellek nem alkalmazhatók napjaink hálózati forgalmának leírására. Ha a forgalom Markov-folyamat lenne, akkor a  ingadozása hosszú ido  átlagolása során kiegyenlítodne,  forgalom eros ami ellentétes a for galom meggyelt jellemzoivel. A valós fogalommal kapcsolatos mérések azt is bizonyítják,  ingadozása nagyon gyakran jelen van. A gyakran vagy mindig ero hogy a forgalom eros  az önhasonlóság fogalmának felhaszsen ingadozó forgalom statisztikailag jellemezheto nálásával. Az önhasonlóságot gyakran összekapcsolják fraktálgeometriai objektumokkal, melyek a nagyításuktól függetlenül egyformának látszanak. A sztochasztikus folyamatok,  idosorok esetében az önhasonlóság kifejezés a folyamat eloszlására utal, amely azonos ma idointervallumban    ingadozásokat rad ha különbözo nézünk. Az önhasonló idosorok jelentos  tartalmaznak, bármely idointervallumban kiugróan magas értékek sokaságával. A hálózati  – mint például a csomagok száma másodpercenként, a bájtok száma forgalom jellemzoi  sztochasztikus idosoroknak.  másodpercenként vagy a keretek hossza – tekinthetok Ezért a

196

5. Hálózatok szimulációja

 idosorok  forgalom ingadozásának meghatározása megegyezik a megfelelo önhasonlóságának jellemzésével. A hálózati forgalom önhasonlóságával foglalkozó cikkek megmutatják, hogy a csomag teljesen más lesz akkor, ha a szimuláció valós vesztés, a puffer kihasználtság és a válaszido forgalomadatokat vagy az önhasonlóságot is tartalmazó mesterséges adatokat használ.  A háttérrol

= 0, 1, 2, . . .) egy stacionárius kovariancia folyamat. Egy h i ilyen folyamatµ = E [Xt ] várható érték konstans, egy σ2 = E (Xt − µ)2 szórásnégyzet és i   h = E (Xt − µ)(Xt+k − µ) /E (Xt − µ)2 (k = 0, 1, 2, . . .) autokorrelációs függvény,

Legyen X

= (Xt

: t

hoz tartozik egy egy r(k)

ami csak k-tól függ. Feltételezzük, hogy X-nek van egy

∼ αk−β ,

r(k)

alakú autokorrelációs függvénye, ahol 0 tálja X

(m)

=

(X

(m)

(k)

: k

=

1, 2, 3, m

=

k

→∞

< β < 1 és α 1, 2, 3, . . .) az

(5.1) egy pozitív konstans. Reprezen új idosorokat, melyeket az ere-

 blokkok átlagolásával kapunk. Minden deti X sorok feletti m méretu,  egymást nem fedo m

= 1, 2, 3, . . . , X (m) -re

egyesített X

(m)

X

(m)

k

=

(Xkm−m+1

+ ··· +

Xkm )/m, (k



1). Továbbá jelölje r

(m)

az

 idosorok autokorrelációs függvényeit.

Az önhasonlóság deníciója Az X folyamatot önhasonlónak nevezzük H  X megfelelo r

(m)

(k)

(m)

=

1

− β/2

önhasonlósági paraméterrel, ha a

egyesített folyamatnak azonos korrelációs struktúrája van, mint X-nek, azaz

= r(k) minden m = 1, 2, . . .

(k

= 1, 2, 3, . . .) esetén.

Az X stacionárius kovariancia folyamatot aszimptotikusan önhasonlónak nevezzük

− β/2 önhasonlósági ha m → ∞, 0.5 ≤ H ≤ 1. H

=

1

paraméterrel, ha minden eléggé nagy k-ra r

(m)

(k)



r(k),

 A hosszú távú függoség deníciója Egy stacionárius folyamat hosszú távon függo,  ha az autokorrelációs értékek összege végtelenhez tart:

P

k

r(k)

→ ∞. Egyébként a folyamat rövid távon függo.  A deníciókból szár-

 folyamatoknak exponenciálisan fogyó, addig a maztatható, hogy míg a rövid távon függo  folyamatoknak hiperbolikusan fogyó autokorrelációik vannak, azaz a hosszú távon függo  eloszlású valószínuségi kapcsolódó eloszlás nehéz farkú. A nehéz farokkal rendelkezo  változók nagy valószínuséggel  generálnak különösen nagy értékeket. Az önhasonlóság fokát a H vagy Hurst-paraméter fejezi ki. A paraméter a folyamat autokorrelációs függvényének a fogyás sebességét mutatja. Amint H

→ 1, az önhasonlóság

  A hosszú távon függo  önhasonló folyamatok esetén és a hosszú távú függoség mértéke is no. H

> 0.5.

Forgalommodellek  ered. KorábA forgalommodellezés a hagyományos hangátviteli hálózatok modellezésébol ban a modellek legtöbbje azon a feltevésen alapult, hogy a modellezett folyamatok mar koviak (vagy általánosabban rövid távon függok). Azonban napjaink nagy sebességu  digi tális csomag-alapú hálózatai a hálózati szolgáltatások és technológiák különbözoségének   köszönhetoen sokkal bonyolultabbak és erosebben ingadozók, mint a hagyományos hangforgalom.

5.8. A forgalom ingadozásának hatása nagy sebességu  hálózatokra

197

5.22. ábra. Az Internetes hálózati forgalom önhasonló természete.

Válaszul az új fejlesztésekre számos kinomult sztochasztikus modellt hoztak létre, mint például a Markov-modulált Poisson-folyamatok, a uid-ow modellek, a markovi érkezési folyamatok, a kötegelt markovi érkezési-folyamat modellek, a csomagsorozat modellek és a Transzformáció-kiterjesztés-minta ( Transform-Expand-Sample”) modellek. Ezek ” a modellek leginkább a kapcsolódó sorbanállási probléma analitikus megoldására helyezik   a hangsúlyt. Általában nem vetik oket össze a forgalom valós jellemzoivel, és nem bizonyít ják, hogy eredményeik összhangban vannak a valós forgalomadatok statisztikai jellemzoivel. A modellek egy másik csoportja megpróbálja követni a valós forgalomadatok statiszti kai jellemzoit. Viszont hosszú ideig a hálózatokkal kapcsolatos kutatások nem rendelkeztek  forgalmi mérésekkel. Azonban az utóbbi években nagy mennyiségu megfelelo  – a Webre és a nagy sebességu  hálózatokra vonatkozó – mérési adatot gyujtöttek  össze és tettek elér hetové. Ezeknek az adatoknak egy része nagy felbontású, órákon, napokon vagy heteken  hónapokról, évekrol  bizkeresztül mért forgalmi adatokat tartalmaz. Más részük hetekrol, tosít információkat. A nagy felbontású adatok statisztikai elemzései bebizonyították, hogy a csomag-alapú hálózatok valós forgalmi adatai alátámasztják az önhasonlóságot. Ezek az eredmények rámutatnak a tradicionális modellek és a mért forgalmi adatok közötti elté résekre. Míg a hagyományos modellekben a feltételezett folyamatok rövid távon függok,  a mért forgalmi adatok bizonyítják a hosszú távú függoséget. A 5.22. ábrán az Internet meg különbözo  felhasználószám forgalom és a hangforgalom közötti különbség gyelheto  a forgalom egyre egyenletesebb lesz, ellentétben esetén. Amint a hangfolyamok száma no, az Internet-forgalommal.  sorbanállási modellekkel ellentétben a hosszútávú függoséggel  A rövid távon függo  modellekkel kapcsolatban eddig jóval kevesebb elméleti eredmény született. rendelkezo  csoportja van: a fraktális Gauss-zajok és a fraktális Az önhasonló modelleknek két fo ARIMA folyamatok. A Gauss-modellek pontosan leírják több forgalomfolyam egyesítését. Az M/Pareto modellt olyan hálózati forgalommodellezésben használták, ahol a Gauss számú egyesített adat. modell alkalmazásához nem állt rendelkezésre elegendo

198

5. Hálózatok szimulációja

Fekete doboz és strukturális modellek  A hagyományos idosorok elemzését fekete doboz modellezésnek nevezzük. Ezzel ellentétben a szerkezeti modellezés arra a környezetre összpontosít, amelyben a modell adatait  napjaink kommunikágyujtötték,  azaz a hálózati komponensek hierarchiájára, melyekbol   elismerik, hogy a fekete doboz modellek ciós rendszerei felépülnek. Míg az elobbi szerzok hasznosak lehetnek más környezetekben, a modern csomag-alapú hálózatok dinamikus és  bonyolult természetének megértésére alkalmatlannak tartják oket. Ezeknek a modelleknek  nem sok haszna van napjaink hálózatainak tervezésében, irányításában és ellenorzésében  sem. Hogy az empirikusan meggyelt jelenségeknek, mint amilyen a hosszútávú függoség is, zikai magyarázatát adjuk, a fekete doboz modelleket strukturális modellekre kell  cserélnünk. A strukturális forgalommodelleknek egy jól alkalmazható jellemzojük, hogy gyelembe veszik napjaink hálózatainak rétegelt felépítését, és elemezni tudják a hozzájuk  kapcsolódó hálózatparamétereket, amelyek alapvetoen meghatározzák a hálózat teljesítmé nyét és muködését.  Az idosor-modellek általában ezeket a részleteket fekete dobozokként kezelik. Mivel a valós hálózatok bonyolult rendszerek, a fekete doboz modellek sok esetben  feltételezik, hogy pontosan ábrázolják a valós rendszert. A hálózatszámos paraméterrol  számára, akik igen fontos alkalmazói a forgalommodellezésnek, a fekete doboz tervezok modellek nem túl hasznosak. Egy bonyolult hálózati környezetben ritkán lehetséges meg számára a mérni vagy megbecsülni a modell nagy számú paraméterét. A hálózattervezok modellnek egyszerunek  és értelmesnek kell lennie az adott hálózatra nézve. A modell támaszkodhat valós hálózati mérésekre, és az eredményeknek helytállóknak kell lenniük a valós hálózat teljesítményére és muködésére  nézve. Sokáig a forgalommodelleket valódi hálózatokban gyujtött  adatok felhasználása nélkül készítették. Ezek a modellek nem voltak alkalmazhatók gyakorlati hálózattervezésre. Nap jainkban a nagy mennyiségu  hálózati forgalmi mérések elérhetosége, és a hálózati struktúra  bonyolultsága miatt egyre inkább alkalmazzák az Ockham borotvája nevu növekvo  elvet. (Ockham borotvája egy középkori lozófus, William Ockham elve volt. Eszerint az elv sze rint a modellezoknek nem szabad a minimálisan szükségesnél több feltételezést tenniük. Ez az alapelv, melyet a takarékosság elvének is hívnak, motiválja az összes tudományos  modellezést és elméletépítést. A modellezoknek az adott jelenség leírására alkalmas ekvivalens modellek közül a legegyszerubbet  kell választaniuk. Ez az elv bármely modell esetén  segíti a modellezoket abban, hogy csak azokat a változókat vegyék be a modellbe, amelyek valóban szükségesek a jelenség magyarázatához. Így a modellek kifejlesztése egyszerubbé    válik, csökken az inkonzisztencia, a félreérthetoség és a redundancia lehetosége.) A szerkezeti modellek bemutatják, hogyan magyarázza a forgalom dinamikájának részleteit az egyes hosztok szintjén a hosztok közötti párbeszédek hálózati forgalomának önhasonló természete. A szerkezeti forgalommodelleknek zikai jelentése van az adott hálózati  környezetben, és nyomatékosítják a hosszútávú függoség túlsúlyát az egyes hosztok közötti párbeszédek által generált csomag érkezési mintákban. Ezek a modellek betekintést nyújtanak abba, hogy az egyes hálózati kapcsolatok hogyan viselkednek helyi és nagy kiterjedésu  hálózatokban. Habár ezek a modellek az összeállított forgalmi minták zikai struktúrájának gyelembevételével túlmennek a fekete doboz modellezési módszertanon, nem tartalmazzák a kapcsolatok, forgalomirányítók, kapcsolók és ezek véges kapacitásainak a forgalmi útvonalakon egybefonódó struktúráját. Crovella és Bestavros megmutatták, hogy a World Wide Web forgalma az önhasonló tulajdonságokat mutat, továbbá hogy a Weben elérheto  állományméretek ságéval egyezo

5.8. A forgalom ingadozásának hatása nagy sebességu  hálózatokra

199

 nehéz farkúak lehetnek. Szintén megmutatták, hogy elsod eloszlása miatt az átviteli idok legesen a felhasználók farkúak lehetnek.

 szintén nehéz gondolkodási idejének” hatása miatt a csendes idok ”

 ingadozás hatása a nagy sebességu Az eros  hálózatokra  ingadozásnak a hálózati torlódásokra gyakorolt hatásai a következok:  Az eros



 A veszteségeket is tartalmazó torlódási periódusok meglehetosen hosszúak lehetnek, és  erosen koncentráltak.



 csökkenését. A pufferméret lineáris növekedése nem okozza a csomagvesztés jelentos



 csomagvesztésAz aktív kapcsolatok számának csekély növekedése is okozhat jelentos növekedést. Az eredmények azt mutatják, hogy a csomagforgalom hullám jellegu.  A hegyes csú-

csok okozzák a tényleges adatvesztéseket, a kisebb hullámzások pedig a kiemelkedéseken lovagolnak tovább.  ingadozás befolyásolhatja a hálózat teljesítményét, az Egy másik terület, ahol az eros olyan ütemezésu  kapcsolat, amely forgalomosztályok közötti prioritásokat tartalmaz. Egy olyan környezetben, ahol a nagyobb prioritású osztályra nincs sávszélességkorlátozás (a zikai sávszélességen kívül), az interaktív forgalom prioritást kaphat a nagy mennyiségu   keresztül erosen  adatforgalommal szemben. Ha a magasabb prioritású osztály hosszú idon  ingadozásai hosszú idore  ingadozik, akkor ezen osztály eros akadályozhatják az alacsonyabb prioritású forgalmat.  ingadozás olyan hálózatokra is hatással lehet, ahol az engedélyezésvezérlési Az eros mechanizmus nem az egyes kapcsolatok forgalom-paraméterein, hanem a közelmúlt forgalmi mérésein alapszik. Az az engedélyezésvezérlés, amely csak a közelmúlt forgalmát  egy hosszú, egészen alacsony forgalmi intenzitású perióveszi gyelembe, félrevezetheto  dust követoen.

5.8.2. Modellparaméterek  inaktív periódusokból állnak. A kliensek és szerverek közötti tranzakciók aktív és azt követo  Ezek a tranzakciók az egyes irányokban küldött csomagok csoportjaiból tevodnek össze. A  ingadozásoknak nevezzük. A forgalom erosen  csomagcsoportokat eros ingadozó volta a  idoparaméterekkel   következo jellemezheto:



Tranzakció érkezési idoköz  ( Transaction Interarrival Time” – TIAT): Egy adott tranz”  csomagja és a következo  tranzakció elso  csomagja között eltelt ido.  akció elso



 ingadozások között Eros  ingadozás érkezési idoköz  ( Burst Interarrival Time”): az eros ”  1/λ, ahol λ az eros  ingadozások beérkezési intenzitása. eltelt ido,



 ingadozásokban a csoCsomag érkezési idoköz  ( Packet Interarrival Time”): az eros ”  1/r, ahol r a csomagok beérkezési intenzitása. magok érkezése között eltelt ido,

A Hurst-paraméter  Elore látható, hogy az egyre több és többféle forgalom gyorsan folytatódó többszolgálta tású hálózatokba való egyesítése végül a forgalom kiegyenlítodését fogja eredményezni.  az egyesítés mértéke, a folyamat Gauss-folyamatokkal modellezheto.  Jelenleg Ha elegendo

200

5. Hálózatok szimulációja

 viszont a hálózati forgalom nem mutat a gaussihoz közeli jellemzoket. A hálózatok nagy  részében az egyesítés mértéke nem elég nagy ahhoz, hogy kiegyenlítse az erosen ingadozó  forgalom negatív hatását. Azonban addig, amíg a forgalom gaussivá nem válik, a létezo   módszerek pontos méréseket és elorejelzéseket nyújthatnak az erosen ingadozó forgalomról. A módszerek többsége a Hurst-paraméter becslésén alapszik – minél nagyobb a H értéke, annál nagyobb az ingadozás, következésképpen rosszabb a kapcsolók és a forgalomirányítók teljesítménye az egyes forgalmi útvonalak mentén. Egyes módszerek megbízha ol  függ, például a becslési technikától, tóbbak másoknál. A megbízhatóság számos tényezot  az idointervallumtól,  a mintamérettol, a forgalmi politikától stb. A publikált mérések alap1

 módszereket . Ezek közül az ján megvizsgáltuk a legkisebb becslési hibával rendelkezo Újraskálázott módosított tartomány ( Rescaled Adjusted Range” – R/S)) módszert válasz”  Benoit csomagban. tottuk, mivel ennek megvalósítását megtaláltuk a hálózatról letöltheto Módszerünkhöz az ezen csomag által kiszámított Hurst-paraméter szolgál bemenetként. Az M/Pareto forgalommodell és a Hurst-paraméter  ingadozásokat tartalmazó, hosszú Ismert, hogy az M/Pareto modell alkalmas a hosszú eros  forgalomfolyamok modellezésére. A modellt eredetileg az ATM pufferszintjeitávon függo  nek az elemzésére javasolták, késobb az Ethernet, VBR videó és egykiszolgálós sorbanállási  rendszerekben IP csomagfolyamok teljesítményének elorejelzésére is használták. A modellt itt nem csak egykiszolgálós sorra alkalmazzuk, hanem olyan összetett rendszerre, melyben kapcsolatok, kapcsolók és forgalomirányítók befolyásolják az egyes hálózatelemek teljesítményét.  Az M/Pareto modell egymást átfedo,

λ

 beérkezési intenzitású eros ingadozások

Poisson-folyamata. Az ingadozások r intenzitással generálnak csomagokat. Minden inga egy Pareto-eloszlású ideig folytatódik. A Pareto-eloszlás dozás az intervalluma kezdetétol  forgalmat jellemzo  nagyon hosszú ingadoalkalmazása eredményezi a hosszú távon függo zásokat. Annak a valószínusége,  hogy egy Pareto-eloszlású X valószínuségi  változó túllép egy x határt:

  γ x    δ , x≥δ Pr { X > x} =   1, egyébként, 1 < γ < 2, δ > 0.

 ingadozások Az X várható értéke, az eros

(5.2)

µ = δγ/(γ − 1) várható hossza és ennek szó-

rásnégyzete végtelen. Egy t intervallumot feltételezve ebben az intervallumban a csomagok M átlagos száma: M

= λtrδγ/(γ − 1) , és M(γ − 1) λ= . tr δγ

(5.3) (5.4)

Az M/Pareto modell aszimptotikusan önhasonló, és a Hurst-paraméterre teljesül, hogy H

1

=

3

−γ 2

.

(5.5)

Szórásnégyzet, együttes szórásnégyzet, Higuchi, maradék-szórásnégyzet, Újraskálázott módosított tartomány,

Whittle becslés, periodogram, regressziós maradéktag

201

5.8. A forgalom ingadozásának hatása nagy sebességu  hálózatokra

 eltelt ido

átlagos sávszélesség

összes bájt/

 bájtok/ bejövo

 bájtok/ kimeno

(másodperc)

kihasználtság %

másodperc

másodperc

másodperc

299

2.1

297.0

159.2

137.8

300

2.2

310.3

157.3

153.0

301

2.1

296.8

164.4

132.4

302

2.7

373.2

204.7

168.5

...

...

...

...

...

5.23. ábra. Nyomkövetési eredmények.

bájtok átlagos

üzenet késés

száma

(milliszekundum)

440.4279

78.687

pufferszint (bájt) 0.04

eldobott csomagok

a kapcsolat sávszélesség kihasználtsága (%) 56 Kbps ATM DS-3 100 Mbps

száma

Frame Relay

szegmens

Ethernet

0

3.14603

0.06

0.0031

 5.24. ábra. A mért hálózatjellemzok.

5.8.3. A Hurst-paraméter megvalósítása a COMNET modellez®eszközben A Hurst-paramétert és az M/Pareto modell egy módosított változatát a COMNET diszkrétesemény szimulációs rendszerben valósítottuk meg. A diszkrét-esemény szimuláció segít  például a kapcsolatok kiségével valósághu  hálózatjellemzoket kaphatunk. Ilyen jellemzo használtsága és a kapcsolók, forgalomirányítók teljesítménye. Módszerünkkel felmérhetjük   az összeállított erosen ingadozó forgalom káros következményeit, és elorejelezhetjük hatását a teljes hálózat teljesítményére. Forgalmi mérések Az alapkongurációs modell felépítéséhez egy nagyméretu  intézményi hálózatban a Con rendszerrel gyujtöttünk cord Network Health nevu  hálózatelemzo  össze nyomkövetési in széles és keskeny sávú kapcsolatokon végeztünk méréseket, pélformációkat. Különbözo dául 45 Mbps ATM, 56 Kbps, és 128 Kbps Frame Relay összeköttetéseken. A Concord Network Health rendszer segítségével adott ideig forgalmi méréseket végezhetünk az egyes  hálózati csomópontoknál, mint például forgalomirányítóknál, kapcsolóknál. Az idointer vallumot 6000 másodpercre állítottuk be, és a következoket mértük: a küldött és fogadott bájtok és csomagok másodpercenkénti számát, a csomag késleltetést, az eldobott csomagok  csomagok számát és az számát stb. A rendszer nem képes mérni az ingadozásokban lévo  ingadozások hosszát, mint ahogy azt az elobbi M/Pareto modellben feltételeztük. Emiatt a  korlátozás miatt a rendelkezésre álló adatoknak megfeleloen kissé módosítjuk a forgalommodellt. ötpercenként készítünk pillanatfelvételeket a egy keskeny sávú Frame Relay kapcsolat forgalomáról egy távoli kliens és egy intézmény szervere között a 5.23. ábra szerinti formában. A küldött bájtok átlagos számát, az üzenetkésést, a kliens helyi forgalomirányítójának a pufferszintjét, az eldobott csomagok számát, és az 56 Kbps sebességu  kapcsolatnak, az ATM hálózat DS-3 szegmensének és a 100 Mbps sebességu  Ethernet kapcsolatnak a célál átlagos kihasználtságait a 5.24. ábra foglalja össze. lomásnál lévo  A COMNET a tranzakciókat a következokkel reprezentálja: üzenetforrás, cél, üzenet  kommunikációs berendezések és kapcsolatok. Az üzeméret, valamint az útvonalon lévo

202

5. Hálózatok szimulációja

 netküldési intenzitás egy beérkezési idoköz eloszlással van megadva, azaz az egymást kö csomagok között eltelt idovel.  veto Az M/Pareto modellben a Poisson-eloszlás

λ intenzitás-

sal generál ingadozásokat vagy üzeneteket. Ezt az információt a szimulációban úgy adjuk  érkezések közötti idointervallum  meg, hogy az egymást követo hossza átlagosan 1/λ. Erre a célra az exponenciális eloszlást használjuk. Az exponenciális eloszlásnak a beérkezések  közötti idore való alkalmazásával egy Poisson-eloszlás szerinti érkezési mintát fogunk ka az Exp(1/λ) függvénnyel implementáltuk. punk. COMNET-ben a beérkezések közötti idot  mintának megfeleloen  A modellben a Concord Network Health-ben lévo 1 másodpercnek  állítottuk be a beérkezési idoközt, ami megegyezik

λ = 1/másodperc beérkezési intenzitás-

sal.  ingadozások Pareto-eloszlású ideig tartanak. MiAz M/Pareto modellben az egyes eros vel a Concord Network Health eszköz nem tudta mérni az ingadozások hosszát, ezért azt feltételezzük, hogy az ingadozást az egy üzenetben küldött vagy fogadott bájtok másod algoritmusa biztosítja, hogy azopercenkénti száma jellemzi. Mivel az ATM cellakezelo  alatt legyenek feldolgozva, ezért a hosszabb üzenetek nos hosszúságú üzenetek azonos ido  igényelnek. Így azt mondhatjuk, hogy az ingadozások idotarta hosszabb feldolgozási idot mának eloszlása megegyezik az ingadozások méretének eloszlásával. Ezért módosíthatjuk  az M/Pareto modellt úgy, hogy a Pareto-eloszlású ingadozás-idotartamot a Pareto-eloszlású ingadozás-mérettel helyettesítjük. Ezután

δ-t

 nem az ingadozások átlagos idotartamából,

 kapjuk. hanem azok átlagos méretébol COMNET-ben a Pareto-eloszlású ingadozásméretet két paraméterrel deniáljuk, a hely és az alak paraméterekkel. A hely paraméter megfelel (5.2)

δ-jának, az alak pedig a γ-nak,

 ami a (5.5) egyenlettel a következoképpen számítható ki:

γ = 3 − 2H.

(5.6)

A Pareto-eloszlásnak végtelen várható értéke és szórása lehet. Ha viszont az alak pa véges lesz. Ha az alak paraméter nagyobb, mint raméter nagyobb, mint 2, akkor mindketto  mint 2, akkor a várható érték véges, viszont a szórásnégyzet 1 és kisebb vagy egyenlo,  1-nél, akkor mind a várható érték, mind a végtelen. Továbbá ha ez kisebb vagy egyenlo szórásnégyzet végtelen.  a következot  kapjuk: A Pareto-eloszlás várható értékébol

δ=

µ · (γ − 1) . γ

(5.7)

  A (5.6) és (5.7) összefüggések lehetové teszik az erosen ingadozó forgalom modellezé lépésekben: sét a valós nyomkövetési eredmények alapján a következo a.

 felhasználáNyomkövetési adatok gyujtése  a Concord Network Health hálózatelemzo sával.

b.

A H Hurst-paraméter kiszámítása a nyomkövetési adatokból a Benoit csomag segítségével.

c.

 o A COMNET eszköz exponenciális és Pareto-eloszlásainak felhasználásával, az eloz  és az üzenetek méterének elleg kiszámított paraméterekkel az érkezések közötti ido oszlásának megadása.

d.

Forgalomgenerálás a módosított M/Pareto modell szerint, és a hálózat teljesítményjel lemzoinek mérése.

5.8. A forgalom ingadozásának hatása nagy sebességu  hálózatokra

203

5.25. ábra. A hálózati topológiának az a része, ahol a méréseket végeztük.

  Az elobbi lépesekkel generált forgalom erosen ingadozó olyan H paraméterrel, melyet valós forgalmi adatokból számítottunk ki.

5.8.4. Az alapkonfigurációs modell érvényesítése Az alapkongurációs modellt úgy érvényesítjük, hogy az 56 Kbps sebességu  Frame Relay  paramétereit összehasonlítjuk a vaés a 6 Mbps sebességu  ATM kapcsolatok különbözo  segítségével kapott adatokkal. Az lós hálózatról a Concord Network Health hálózatelemzo összes bájtok/másodperc” oszlopot vizsgáljuk. A valós for” galomnak a Benoit csomag által kiszámított Hurst-paraméter értéke H = 0.55. A hálózat egyszeruség  kedvéért csak az

topológiája a 5.25. ábrán látható. Az üzenetforrások” ikon egy alhálózatot reprezentál, mely egy token ring hálózatból, ”  áll, mely a Célhálózat” alhálózatban lévo  egy helyi forgalomirányítóból és egy A kliensbol ” B kiszolgálónak küld üzeneteket (5.26. ábra).  A beérkezési idoköz és az üzenetek mérete az Exp(1) exponenciális és a Par(208.42, 1.9) Pareto függvényekkel van deniálva. A Pareto-eloszlás helyét (208.42) és alakját (1.9)  ingadozások átlagos hosszának a (5.7) és (5.7) képletek segítségével számítottuk ki az eros (ez 440 bájt a 5.24. ábra alapján) és a H

= 0.55 paraméternek a behelyettesítésével (5.27.

ábra).  nehéz farkú Pareto-eloszlást és a kumulatív eloszlásfüggA 5.28. grakon a megfelelo vényt szemlélteti (Az X tengelyen a bájtok számát ábrázoltuk).  reprezentál 56 K információátviteli A Frame Relay” ikon egy kerettovábbítási felhot ” intenzitással ( Committed Information Rate” – CIR). A Conc” forgalomirányító a Frame ” ” Relay hálózatot egy 6 Mbps sebességu,  változó intenzitásirányítással ( Variable Rate Cont”  ATM hálózathoz kapcsolja. Ezt a 5.29. és 5.30. ábra szemlélteti. rol” – VBR) rendelkezo A

Célhálózat” jelöli a B kiszolgálót tartalmazó alhálózatot, melyet a 5.31. ábra szem”

204

5. Hálózatok szimulációja

5.26. ábra. Az

”

üzenetforrás” távoli kliens.

 5.27. ábra. A kliens által küldött üzenetek beérkezési idoköze és mérete.

léltet. A modell eredményei a Frame Relay kapcsolat kihasználtságát tekintve (0.035

∼ 3.5%)

majdnem azonosak a valós mérésekkel (3.1%) (5.32. ábra). Az üzenetek késleltetése szintén nagyon közel van a kliens és a szerver közötti mért értékhez (78 milliszekundum) (5.33. ábra). A 5.34. ábrán látható, hogy a kliens forgalomirányítójának input puffer szintje körülbelül azonos a mért értékkel. Hasonlóan, az ATM hálózat DS-3 kapcsolat-szegmensének és a célhálózat Ethernet kapcsolatának kihasználtsága is jól közelíti a valós hálózat méréseit (5.35. ábra).  a modell nyomkövetési eredményeibol,  hogy a H Az is meggyelheto

= 0.55

Hurst-

 paraméterrel a modell majdnem ugyanolyan erosen ingadozó forgalmat generál, mint a valós hálózat. Továbbá az eldobott csomagok száma a modellben és a méréseknél is nulla. Így tehát van egy olyan kiinduló modellünk, amely jól reprezentálja a valós hálózatot.

5.8. A forgalom ingadozásának hatása nagy sebességu  hálózatokra

5.28. ábra. A Pareto-eloszlás 400 bájt várható érték és H

205

= 0.55 Hurst-paraméter esetén. Az ábra színes változata

a 809. oldalon látható.

 kapcsolatai. 5.29. ábra. A 6 Mbps sebességu,  változó intenzitásirányítású ATM hálózat belso

5.8.5. A forgalom er®s ingadozásának következményei Módszerünk illusztrálására kifejlesztettünk egy COMNET szimulációs modellt a forgalom  ingadozásának a hálózati kapcsolatokra, az üzenetek késleltetésére, a forgalomirányíeros tók input pufferere és a nagy számú felhasználótól származó összetett forgalom miatt eldobott csomagok számára gyakorolt következményeinek mérésére. A modell a 5.3. alfeje zetben leírt módon valósítja meg a Hurst-paramétert. Hogy a ritka események is megfelelo  számban eloforduljanak, a szimulációt 6000, 16000 és 18000 másodpercig ismételtük. Az eredményt mindegyik esetben nagyon hasonlónak találtuk.  Az erosen ingadozó forgalom forrásainak topológiája  üzenetforrás” alhálózatok az elobbi alapkongurációs modell szerint továbbítják az ”  ingadozási paraméterrel: H = 0.95, H = 0.75 és üzeneteket, azonos mérettel de különbözo Az H

= 0.55. Kezdetben négy alhálózat muködését  szimuláltuk, alhálózatonként négy felhasz-

206

5. Hálózatok szimulációja

 5.30. ábra. A 6 Mbps sebességu  ATM kapcsolat jellemzoi.

5.31. ábra. A

”

Célhálózat” alhálózat.

 oekkel   nálóval, melyek mindegyike az eloz megegyezoen ugyanolyan mennyiségu  adatot küldött (átlagosan 440 bájtot másodpercenként) (5.36. ábra). Kapcsolat-kihasználtság és üzenetkésleltetés  Eloször is egy Frame Relay kapcsolaton szeretnénk mérni és illusztrálni a különösen magas kihasználtság és üzenetkésleltetés csúcsokat. A modell forgalmát adó üzenetek méretét

5.8. A forgalom ingadozásának hatása nagy sebességu  hálózatokra

5.32. ábra. A Frame Relay kapcsolat kihasználtsága az alapkongurációs modellben.

5.33. ábra. Az üzenetek késleltetése a kliens és a szerver között.

5.34. ábra. A távoli forgalomirányító input puffer szintje.

207

208

5. Hálózatok szimulációja

5.35. ábra. A DS-3 kapcsolat és a célhálózat Ethernet kapcsolatának kihasználtsága.

  Hurst-paraméterekkel. 5.36. ábra. Erosen ingadozó forgalom forrásainak topológiája különbözo

azonos méretu  üzenetek

H

= 0.55

H

= 0.75

H

= 0.95

átlagérték

0.12

0.13

0.13

0.14

csúcsérték

0.18

0.48

1

1

5.37. ábra. A szimulált kapcsolat-kihasználtságok átlagos és csúcsértékei.

 Hurst-paraméterek határozzák meg. Az üzenetek az összehasonlíthatóság érdekülönbözo kében azonos méretuek.  A COMNET eszköznek van egy nyomkövetési opciója is, mellyel  adatokat tud gyujteni  a modell által generált forgalomról. Azt is ellenoriztük, hogy a kü Hurst-paraméterek esetén generált forgalomfolyamokból a Benoit-csomag hasonló lönbözo Hurst-paramétereket számít ki. A 5.37. ábrán az egyes szimulált esetek kapcsolat-kihasználtságainak átlagos és csúcsértékei láthatók. A kihasználtságok nem százalékban, hanem [0,1] intervallumbeli értékekként vannak kifejezve.  alfejezetben található ábrák jól láthatóvá teszik, hogy annak ellenére hogy A következo

209

5.8. A forgalom ingadozásának hatása nagy sebességu  hálózatokra

azonos méretu  üzenetek

H

= 0.55

H

= 0.75

H

= 0.95

 (ms) átlagos válaszido

75.960

65.61

87.880

311.553

 csúcsérték (ms) válaszido

110.06

3510.9

32418.7

112458.08

0.470

75.471

716.080

4341.24

standard eltérés

 és eros  ingadozás. 5.38. ábra. Válaszido

azonos méretu  üzenetek elfogadott csomagok blokkolt csomagok

átlagos pufferhasználat bájtokban

13282

H

= 0.55

12038

H

= 0.75

12068

H

= 0.95

12622

1687

3146

3369

7250

56000858

61001835

62058222

763510495

 ingadozás közötti kapcsolat. 5.39. ábra. Az eldobott cellák száma és az eros

a kapcsolat átlagos kihasználtsága közel azonos, a csúcsértékek gyakorisága és mérete nö vekszik az ingadozás erosödésével, ez pedig cellavesztéseket okoz a forgalomirányítókban  és a kapcsolókban. A válaszidore a 5.38. ábrán látható eredményeket kaptuk.  Hurst-paraméterek és a Az A függelék grakonjai grakusan illusztrálják a különbözo  közötti kapcsolatot. válaszidok Az input pufferek szintje nagy számú felhasználó esetén  Megmértük az erosen ingadozó cellaforgalom miatt az ATM hálózat egy forgalomirányítójának input pufferénél eldobott cellák számát is. Körülbelül 600 felhasználó összegzett  forgalmát szimuláltuk, melyek a valós forgalmi mérésekkel egyezoen ugyanannyi bájtot küldtek el másodpercenként. Az 5.39. ábra a blokkolt csomagok számát foglalja össze az egyes eseteknél.

5.8.6. Következtetések  oekben  Az eloz egy diszkrét-esemény szimulációs módszert mutattunk be, amely alkalmas  erosen   különbözo ingadozó forgalmat továbbító hálózatok jellemzoinek mérésére. Korábbi  tanulmányok bebizonyították, hogy az erosen ingadozó adatfolyamok egyesítése szintén  erosen ingadozó adatfolyamot eredményez. Ezért a hagyományos, hálózattervezésre használt módszerek és modellek módosítására van szükség. A mi módszertanunkat a fekete doboz modellek helyett a strukturált modellek csoportjába soroljuk. A strukturális modellek arra a környezetre összpontosítanak, amiben a modellek adatai össze lettek gyujtve,   napjaink kommunikációs rendszeazaz a hálózati komponensek hierarchiájára, melyekbol rei felépülnek. Habár a fekete doboz modellek hasznosak lehetnek más környezetekben,  nem olyan könnyu  oket alkalmazni napjaink hálózatainak tervezésében, irányításában és el lenorzésében. Egy jól ismert modellt, az M/Pareto modellt implementáltuk a COMNET  diszkrét-esemény szimulációs csomag felhasználásával. Ez lehetové teszi az önhasonló forgalom káros következményeinek elemzését nem csak egy egykiszolgálós sorra, hanem  kapcsolódó hálózati komponensek összteljesítményére nézve is. Valós hálózati különbözo nyomkövetési információk felhasználásával olyan modellt készítettünk és érvényesítettünk,  mellyel mérni és grakusan illusztrálni tudtuk az erosen ingadozó forgalomnak a kapcsolatok kihasználtságra, az üzenetkésleltetésekre és a pufferek teljesítményére gyakorolt hatását   ingadozás nagyon Frame Relay and ATM hálózatokban. Megmutattuk, hogy az erosöd o  és sok eldobott csomagot eredményez, továbbá nagy kapcsolat-kihasználtságot, válaszidot

210

5. Hálózatok szimulációja

5.40. ábra. A Frame Relay link kihasználtsága azonos méretu  üzenetek esetén.

 teljesítményjellemzoket.  szimulációval meghatároztunk különbözo A csomagválasztás hangsúlyozza olyan eszközöknek a szükségességét, melyek haszno és mérnökök számára sak lehetnek nem csak elméleti szakemberek, hanem hálózattervezok  jól ismert elméleti eredmények és ezeknek a mindennapi gyakorlati is. Ez a cikk a meglévo, hálózatelemzésben és modellezésben való alkalmazása közötti rést szeretné csökkenteni.   meggyelo  és irányító eszközökben rendelkezésre állnáMeglehetosen jó volna, ha a méro,  forgalommodellek. Az itt tárgyalt modell segítheti a forgalommodellezés nak a megfelelo   elsodleges felhasználóit, a hálózattervezoket és mérnököket abban, hogy megértsék a háló zati forgalom dinamikus természetét, továbbá támogathatja oket mindennapi munkájukban.

5.9. Mérési adatok bemutatása 5.9.1. Kapcsolat-kihasználtsági mérések  Hurst-paraméterek esetén az átAz 5.40–5.42. ábrák azt szemléltetik, hogy bár a különbözo lagos kapcsolat-kihasználtságok majdnem azonosak, az ingadozás növekedésével a csúcsér ez pedig a forgalomirányítókban és kapcsolókban cellavesztékek gyakorisága és mérete no, téseket okoz. A kihasználtságok nem százalékban, hanem [0,1] intervallumbeli értékekként vannak kifejezve.

5.9.2. Üzenetkésleltetési mérések  Hurst-paraméterek és a válaszidok  A 5.43–5.45. ábrák a különbözo közötti kapcsolatot szemléltetik.

Gyakorlatok  fogalmakhoz kapcsolódó tulajdonságot, ese5.9-1. Nevezzünk meg néhány, a következo ményt, tevékenységet és állapotváltozót:



Kiszolgáló



Kliens



Ethernet

211

5.9. Mérési adatok bemutatása

5.41. ábra. A Frame Relay link kihasználtsága H

= 0.75 Hurst-paraméter esetén (magasabb csúcsokkal).

5.42. ábra. A Frame Relay link kihasználtsága H

= 0.95 Hurst-paraméter esetén (sok magas csúccsal).

5.43. ábra. Üzenetkésleltetés azonos méretu  üzenetek esetén.

• • •

Csomagkapcsolt hálózat Híváslétesítés celluláris mobil hálózatban A TCP lassú indulás algoritmusa

5.9-2. Olvassunk el egy cikket a hálózatok szimulációjának alkalmazásáról, és írjunk beszámolót arról, hogyan közelíti meg a cikk a modell érvényesítést.

212

5. Hálózatok szimulációja

5.44. ábra. Üzenetkésleltetés H

5.45. ábra. Üzenetkésleltetés H

= 0.55 esetén (magasabb válaszido csúcsokkal).

= 0.95 esetén (nagyon magas válaszido csúccsal).

 szoftver 5.9-3. Ez a gyakorlat feltételezi, hogy rendelkezésre áll valamilyen hálózatelemzo (például Lananalyzer for Windows vagy bármilyen más eszköz), mely elemezni tudja a há  lózati forgalmat és információkat tud gyujteni  róla. A következokben mi az elobb említett eszközt használjuk.



Kezdjük el egy állomány továbbítását a helyi hálózatban egy kliens és egy kiszolgáló között. Figyeljük meg a részletes statisztikákat az adatátviteli vonal kihasználtságáról és  grakonokat. a másodpercenként átvitt csomagok számáról, majd mentse el a megfelelo



A Lananalyzer Help menüjénél válasszuk ki és olvassuk el a Packets” fejezetet.

Capturing and Analyzing ”



Az állomány átvitele során csak a kliens és a kiszolgáló közötti csomagokat vizsgáljuk.



Mentsük el a csomagokról gyujtött  nyomkövetési információkat .csv formátumban.  felhasználásával. Figyeljük meg, vannakElemezzük ezt az állományt táblázatkezelo  e szokatlan protokoll-események, mint például a csomagok között eltelt túl hosszú ido, túl sok hibás csomag stb.

 hálózatelemzési és alapkonguráció ké5.9-4. Ebben a gyakorlatban a Sniffer különbözo  tevékenysészítési funkcióit vizsgáljuk. Az alapkonguráció deniálja a hálózatot jellemzo  muködést. geket, és ennek ismeretében fel tudjuk ismerni a tipikustól eltéro  Ezt okozhatja

5.9. Mérési adatok bemutatása

213

valamilyen probléma, vagy a hálózat növekedése is. Az alapkongurációs adatokat akkor kell gyujteni,  amikor a hálózati muködése  tipikusnak mondható. Egyes statisztikák készítéséhez, mint például a sávszélesség-kihasználtság vagy a csomagok száma másodpercenként,  egy olyan grakont kell készíteni, amely egy adott idointervallumban ábrázolja az informá ciókat. Erre azért van szükség, mert az olyan mintavétel, amely túl rövid idointervallumban  lehet. Egy vagy több hálózatkomponens hozzáadása után érdegyujt  adatokat, félrevezeto   mes egy alapkongurációt készíteni, így késobb össze lehet hasonlítani a hozzáadás elotti és utáni tevékenységeket. Az összegyujtött  adatok exportálhatók más programok, például táb és modellezoeszközök  lázatkezelok számára, amelyekkel további elemzéseket készíthetünk és amelyek segítik az összegyujtött  adatok kezelését.  eszköz. Számos jól integrált funkA Sniffer egy nagyon jól alkalmazható hálózatelemzo  ciót tartalmaz, melyeket a következokre használhatunk:

• • • •

Forgalomnyomkövetési információk gyujtése  részletes elemzés céljára. Problémák megállapítására az Expert Analyzer alkalmazásával. A hálózati tevékenységeknek valós ideju  meggyelésére. Részletes kihasználtsági és hibastatisztikák gyujtésére  az egyes állomásokról, párbeszé vagy a hálózat bármely részérol.  dekrol



A korábbi kihasználtsági és hibainformációknak alapkongurációs elemzés céljára tör tárolására. téno



 látható és hallható riasztások létProblémák esetén az adminisztrátorokat gyelmezteto rehozására.



 forgalomszimulációs vizsgálatára, válaszido  méA hálózat aktív eszközökkel történo résre, hop számlálásra és hibaelhárításra.



 A Monitor menü History Samples pontja lehetové teszi a hálózati tevékenységeknek  egy idointervallumon keresztül való rögzítését. Ezek az adatok használhatók az alapkonguráció elkészítéséhez, ami segíti az egyes határértékek beállítását, melyeknek a  muködés  átlépése kiváltja az egyes riasztásokat. Tonormálistól eltéro  esetén törtno vábbá ezek az adatok szintén hasznosak a hálózat terhelésének a hosszú távú változá   sainak meghatározására, így tervezhetové válnak a jövobeli hálózatbovítések.



 meg vele. Egy adott tevéEgyidejuleg  legfeljebb 10 hálózati tevékenység gyelheto kenység meggyelésére több statisztikakészítés is elindítható, így egyidejuleg  mind a  rövid, mind a hosszú távú tendenciák rögzíthetok. A korábbi minták meggyelérése rendelkezésre álló hálózati események az Adapter párbeszédablakban kiválasztott  függenek. Például, egy token ring hálózat esetén a különbözo  token ring keadaptertol  meg, Frame Relay hálózat rettípusok mintái (mint például a beacon keretek) gyelhetok

214

5. Hálózatok szimulációja

 Frame Relay kerettípusok (például LMI keretek) mintái. A esetén pedig a különbözo  események adapterenként változnak. meggyelheto Gyakorlati feladatok:



 (Capture/Dene lter) a saját PC-je és valamelyik távoli munÁllítsunk be egy szur  ot kaállomás között az IP forgalom mintavételezésére.



 Állítsuk be a Monitor/History Samples/Multiple History-nál a következoket: Octets/s (Oktet/másodperc), Utilization (Kihasználtság), Packets/s (Csomag/másodperc), Collision/s (Ütközés/másodperc), és Broadcasts/s (Üzenetszórás/másodperc).



Állítsuk be a mintavételi intervallumot 1 másodpercre (jobb klikk a Multiple ikonon és ott properties, Sample).

• •

Indítsuk el a hálózat meggyelését (jobb klikk a Multiple ikonon, majd Start Sample). Szimuláljunk valamilyen szokásos hálózati forgalmat, például töltsünk le egy nagyméretu  állományt egy kiszolgálótól.



Rögzítsük a



Állítsuk a Tools/Options/MAC/Threshold-nál az oktet/másodperc értékét az alapkon-

Multiple History”-t ezalatt a szokásos hálózati forgalom” alatt. Ezt te” ” kintjük az alapkongurációnak. gurációs érték 10-szeresére(???). Deniáljunk egy riasztást az oktet/másodpercre: Amikor eléri ezt a határértéket, küldessünk egy levelet a saját elektronikus címünkre. Az 5.46. ábrán azt feltételezzük, hogy ez a határérték 1000.

• • • •

A riasztást a 5.47. ábrán látható módon adjuk meg.  Ezután állítsuk be az SMTP kiszolgálót a helyi, saját levelezoszerverére (5.48. ábra). A probléma komolyságát (Severity) állítsuk kritikusra (Critical) (5.49. ábra). Gyujtsünk  nyomkövetési információkat a forgalomról (Capture/Start) az állomány letöltése alatt.



 A letöltés befejezodése után állítsuk le az információgyujtést  (Capture/Stop majd Display).

• •

Az Expert Decode opcióval elemezzük a csomagok TCP/IP rétegeit! Nézzük meg, megérkezett-e a Sniffer Pro-tól a

riasztás e-mail”. Várhatóan az alábbi” hoz hasonló levelet fogjuk kapni, mely jelzi az oktet/másodperc határérték túllépését:

From: ... Subject: Octets/s: current value = 22086, High Threshold = 9000 To: ... This event occurred on ...  állományokat: Mentse el a következo

• • •

A

Baseline screens”-t ” A Baseline Multiple History.csv állományt A

riasztás e-mail”-t ”

5.9-5. A gyakorlat célja egy alapkongurációs modell felépítése és érvényesítése egy há eszköz felhasználásával. Feltételezzük, hogy a modellezo  számára elérheto  lózatmodellezo

215

5.9. Mérési adatok bemutatása

5.46. ábra. Beállítások.

 egy szimulációs modellezoeszköz, például a COMNET vagy az OPNET.   statisztikákat egy távoli számítógép pingelésével. A ping Eloször gyujtsünk  válaszido  egy kiszolgálóhoz küldött csomagok oda-vissza útparancs a hálózaton egy adott klienstol  ping hosztnév -n x -l jának idejét méri. A parancs egy lehetséges formátuma a következo:

> fájlnév. Itt x” a küldendo csomagok száma, y” a csomaghossz bájtokban, z” ” ” ”  az idotúllépési érték és a fájlnév” az állomány neve, amibe az összegyujtött  statisztikák ” kerülnek. y -w z

Például, a ping 138.87.169.13 -n 5 -l 64

> c:

 állományt hozza létre: ping.txt parancs a következo

Pinging 138.87.169.13 with 64 bytes of data: Reply from 138.87.169.13: bytes=64 time=178ms Reply from 138.87.169.13: bytes=64 time=133ms Reply from 138.87.169.13: bytes=64 time=130ms Reply from 138.87.169.13: bytes=64 time=127ms Reply from 138.87.169.13: bytes=64 time=127ms



TTL=124 TTL=124 TTL=124 TTL=124 TTL=124

 felhasználásával készítsünk egy hisztogramot ezekrol  az idokr  ol  és Egy táblázatkezelo a csomagok sorszámáról.

216

5. Hálózatok szimulációja

5.47. ábra. Új riasztás akció.

5.48. ábra. Levelezési információk.

217

5.9. Mérési adatok bemutatása

5.49. ábra. Beállítások.



 ol.  Készítsünk hisztogramot a válaszok számáról és a válaszidokr



 kumulatív sur Készítsük el a válaszidok  uségfüggvényét,  az eloszlás farkánál a részleteket is feltüntetve.



  o  Készítsük el az átvitelek alapkongurációs modelljét. A forgalomjellemzoket az eloz lépésben készített kumulatív sur  uségfüggvény  határozzuk meg.



Érvényesítsük a modellt.



Mennyi a kapcsolat kihasználtsága 32 és 64 bájt hosszúságú üzenetek esetén?

 számára elérheto  egy szimulációs modellezoesz 5.9-6. Feltételezzük, hogy a modellezo köz, mint például a COMNET, OPNET stb. Ebben a gyakorlatban néhány gyakran hasz nált kép-állomány helyét szeretnénk meghatározni egy laborban. Az elorejelzések szerint  évben az új kliensek hozzáadása megháromszorozza ezeknek az állományoka következo nak a használatát. Ezek tárolhatók vagy a kiszolgálón, vagy a kliens munkaállomásokon.  A könnyebb karbantartás miatt a kiszolgálón való tárolást részesítjük elonyben. Az aktuális hálózatnak egy alapkongurációs modelljét fogjuk elkészíteni, és megmérjük a kapcsolatkihasználtságot az állományátvitelek alatt. Továbbá érvényesítjük a modellt az aktuális for  galomjellemzokkel. A forgalom skálázásával elorejelezhetjük a kapcsolat-kihasználtságot a munkaállomások hozzáadása után megháromszorozódott forgalom esetén.



Készítsük el az alapkongurációs modell topológiáját.



 Gyujtsünk  forgalom-nyomkövetési információkat az átvitel alatt, és importáljuk oket.

218 •

5. Hálózatok szimulációja

Futtassuk és érvényesítsük a modellt (Az átvitt üzenetek számának a modellben meg  számmal, a szimuláció ideje egyenkell egyeznie a nyomkövetési állományban lévo   – ( Interpacket Time”) - összegével, és a lonek kell lennie a csomagok közötti idok ”  kapcsolat-kihasználtságnak közel egyenlonek kell lennie a nyomkövetés alatti átlagos kihasználtsággal).



 Írassuk ki az átvitt üzenetek számáról, az üzenetkésleltetésrol, a protokollok általi

• •

Háromszorozzuk meg a forgalmat.

kapcsolat-kihasználtságról és a teljes kapcsolat-kihasználtságról szóló jelentéseket.

 Írassuk ki az átvitt üzenetek számáról, az üzenetkésleltetésrol, a protokollok általi kapcsolat-kihasználtságról és a teljes kapcsolat-kihasználtságról szóló jelentéseket.



Ha a kapcsolat-kihasználtság az alapkongurációs határérték alatt van, akkor a kiszol gálón hagyjuk a kép-állományokat, egyébként a munkaállomásokra helyezzük át oket.



Kérdés: Hol érdemesebb tárolni ezeket, a klienseken vagy a kiszolgálón?

5.9-7.

Ennek a gyakorlatnak a célja az osztott és a kapcsolt Ethernet teljesítményének

összehasonlítása. Megmutatjuk, hogy az örökség ( legacy”) vagy osztott Ethernet átala” kítása kapcsolt Ethernetté csak akkor indokolt, ha az ütközések száma meghalad egy adott határértéket. a) Készítsük el egy osztott Ethernetet használó helyi hálózati kliens/szerver alkalmazás modelljét. A modell tartalmaz egy 10Base5 Ethernetet, mely egy kiszolgálót (Webszerver) és három számítógépcsoportot kapcsol össze (Kliens 1, Kliens 2, Kliens 3). Minden csoportnak három számítógép a tagja, továbbá minden csoportnak van egy

Web Request” ” Web Server” alkalmazása ” válaszol. Minden Web Request” forgalmat generál a kiszolgálóhoz. Amikor a kiszolgáló ” megkap egy Web Request” üzenetet, olyankor egy Web Response” üzenetet generál és ” ”  kliensnek. elküldi a megfelelo nevu  üzeneteket generáló forrása. A kiszolgálónak ezekre egy



Minden



A Webszerver visszaküld egy üzenetet

Web Request” egy 10000 byte hosszú üzenetet jelent, amit a forrás min” den Exp(5) másodpercben küld a Webszerverhez. Állítsa az üzenet szövegét Web ” Request”-re. Web Response” szöveggel. Az üzenet mérete ” 10000 és 100000 bájt között változik, ezt a Geo(10000, 100000) eloszlás határozza meg. A szerver csak a kapott

Web Request” üzenetekre válaszol. Állítsa a válaszüze” Web Response”-ra. ” A többi paraméternél használjuk az alapértelmezett értékeket. netet

• • • • •

Válasszuk

a Csatornakihasználtságot” ( Channel Utilization”) és az Ütközési ” ” ” statisztikák”-at ( Collision Stats”) a Kapcsolatok beszámolói”-nál ( Links Reports”). ” ” ” Válasszuk az Üzenetkésleltetés”-t az Üzenet + válaszjelentés”-nél ( Message + Res” ” ” ponse Source Report”). Futtassuk a szimulációt 100 másodpercig. Megadhatjuk az animáció opciót is.  Kapcsolat-kihasználtság”-ot és az Ütközési statisztikák”-at megjeleníto ” ”  szóló jelentést. jelentést, valamint a forgalom forrásai közötti üzenetkésleltetésrol

Írassuk ki a

 csökkentése érdekében alakítsuk át az osztott LAN-t kapcsolt LAN-ná. b) A válaszido A kliens-szerver paramétereket és az Ethernet sebességét változatlanul hagyva helyezzünk

5.9. Mérési adatok bemutatása

219

el egy Ethernet kapcsolót a kliensek és a szerver közé. (A szerver egy full-duplex 10Base5 kapcsolattal csatlakozik a kapcsolóhoz.)



 Kapcsolat-kihasználtság”-ot és az Ütközési statisztikák”-at megjeleníto ” ”  szóló jelentést. jelentést, valamint a forgalom forrásai közötti üzenetkésleltetésrol

Írassuk ki a

c) Mindkét modellben cseréljük a 10Base5 kapcsolatokat 10 BaseT kapcsolatokra. Ek o  esetekkel ellentétben nem azonos mértéku kor az eloz  relatív javulást fogunk tapasztalni a  válaszidoben. Magyarázzuk meg, miért. 5.9-8.

 egy-egy Egy vállalat helyi hálózatának egy része két alhálózatból áll. Mindketto

osztályt szolgál ki. Az egyik hálózat az IEEE 802.3 CSMA/CD 10BaseT Ethernet szabvány szerint üzemel, a másik pedig az IEEE 802.5 16Mbps Token Ring szabvány szerint. A két hálózat egy Cisco 2500-as forgalomirányítóval van összekapcsolva. Az Ethernet LAN 10 számítógépet tartalmaz, melyek közül egy e-mail szervernek van kijelölve mindkét osztály számára. A token ring LAN szintén 10 számítógépet tartalmaz, melyek közül egy fájlszervernek van kijelölve az osztályok számára. A vállalat jelenleg mindkét osztályra alkalmazottak felvételét tervezi. Habár a jelenlegi hálózati konguráció valószínuleg  nem lesz képes kiszolgálni az új alkalmazottakat, a vállalatnak nincs semmilyen módszere a hálózat kihasználtságának vagy a késleltetésének  szeretné felmérni ezeket az aktuális mérésére. A vállalat az új alkalmazottak felvétele elott alapkongurációs szinteket. Az alkalmazottak egyébként is már mindkét osztályról panasz való letöltés lassúsága miatt. kodtak a fájlszervertol A LAN-okon keresztülfolyó közös forgalomnak egy felmérése szerint a forgalom több forrásokból származik: elektronikus levelezésbol,  a különbözo  alkalmasége a következo  és a hang alapú levelezési rendszerbol,  amely lehetové  zások állomány-átvitelébol teszi a  számára, hogy hallható üzeneteket küldjenek az osztályukon dolgozó alkalmazotvezetok  statisztikai leírásának alapjául az alkalmazottakkal folytatott taknak. Az üzenetjellemzok beszélgetések és az üzenetek átlagos méretének becslése szolgált. Az elektronikus levelezést minden alkalmazott használja mindkét osztályon. Az inter júkból kiderült, hogy a levélküldések idoköze leírható egy 900 másodperc várható értéku  exponenciális eloszlással. A levelek mérete pedig leírható egy olyan egyenletes eloszlással, mely szerint a levélméret 500 és 2000 bájt között van. Az összes e-mail az Ethernet hálóza e-mail szerverhez továbbítódik, ahol pedig a megfelelo  felhasználó postaókjában ton lévo kerül tárolásra.  kell leHa egy felhasználó el akar olvasni egy levelet, akkor azt az e-mail szervertol  kérnie. A postaók ellenorzéseinek ideje leírható egy Poisson-eloszlással, melynek várható értéke 900 másodperc. Az erre használt üzeneteknek a mérete 60 bájt. Ha egy felhasználó le szeretne tölteni egy levelet, akkor a szerver beolvassa a felhasználóhoz tartozó állományt és továbbítja a kért levelet az adott alkalmazott számítógépére. Az állomány beolvasásának  üzenetek feldolgozásának ideje leírható egy egyenletes eloszlással, mely 3 és a benne lévo és 5 másodperc közötti értékeket vehet fel. A levelek mérete egy normális eloszlással írható le, melynek várható értéke 40000 bájt és standard eltérése 10000 bájt. Mindkét osztályon nyolc alkalmazott van, akiknek saját számítógépe van, és akik a  is kérnek le állományokat. Ezeknek a kéréseknek az érkezési idoköze  fájlszervertol leírható egy 900 másodperc várható értéku  exponenciális eloszlással. A kérések mérete egyenletes eloszlást követ, 10 bájt minimummal és 20 bájt maximummal. Ezeket a kéréseket kizárólag  fájlszervernek küldik. Egy kérés érkezésekor a szerver beola token ring hálózatban lévo

220

5. Hálózatok szimulációja

5.50. ábra. Hálózati topológia. Az ábra színes változata a 810. oldalon látható.

vassa a kért állományt és elküldi az adott számítógépnek. Ez a feldolgozás csak nagyon kis késleltetést jelent. Az állományok mérete egy normális eloszlással írható le, melynek várható értéke 200000 bájt és standard eltérése 25000 bájt.  használják, akik általában A hang alapú üzenetküldést mindkét osztályon csak a vezetok  alkalmazottaknak küldenek ilyen üzeneteket. A továbbító csak a saját részlegükben lévo  alkalmazás eloször kapcsolatot létesít az alkalmazott számítógépével. Ha ez felépült, akkor továbbítja az üzenetet. Ezek mérete normális eloszlással írható le, melynek várható értéke  50000 bájt és standard eltérése 1200 bájt. Beérkezési idoközük szintén normális eloszlással írható le, melynek várható értéke 1000 másodperc és standard eltérése 10 bájt. Az összes üzenetforrás a TCP/IP protokollkészletet használja, és a csomagok elkészítésének becsült ideje 0.01 milliszekundum. A hálózat topológiájának hasonlónak kell lennie a 5.50. ábrán a COMNET-ben láthatóhoz.  jelentések használhatók a szimulációnál: A következo



Kapcsolatjelentések: Csatorna-kihasználtság és Ütközési statisztikák az egyes kapcsolatok esetén.



Csomópontjelentések: A beérkezett üzenetek száma az egyes csomópontok esetén.



Üzenet és válasz jelentések: Az üzenetek késleltetése az egyes csomópontok esetén.



Session Source jelentések: Az üzenetek késleltetése az egyes csomópontok esetén.  fog észlelni a fájlszervernél. Ha a A modell futtatásakor jóval nagyobb válaszidot

  igényel, akkor milyen megoldást lehet javaszolgáltatás-minoségi szint kisebb válaszidot solni annak csökkentésére? Jó megoldás lenne még egy fájlszerver üzembe helyezése az

5. Megjegyzések a fejezethez

221

Ethernet hálózatban? Mi mást lehetne még módosítani?

Megjegyzések a fejezethez  A hálózaLaw és Kelton monográája [280] jó áttekintést ad a hálózati rendszerekrol. tok osztályozásával kapcsolatban két, magyarul is megjelent monográát ajánlunk, melyek  Sima, Fountain és Kacsuk [432], illetve Tanenbaum [457] szerzoi A valószínuségszámítás  alapjaival kapcsolatban Prékopa András [377] és Rényi Alfréd [393] könyveit ajánljuk. A leggyakoribb statisztikai eloszlásokat Banks könyve [29] alapján foglaltuk össze. A sur  uségfüggvények  ábrázolására használt COMNET szimulációs modellezési eszközt ismertetése megtalálható a CACI két kiadványában [65, 235]. A szimuláció matematikai hátterével kapcsolatban Kátai Imre jegyzetét [244], a sorbanállás elméletével kapcsolatban pedig Kleinrock könyvét [256] és Sztrik János hálózatról  tananyagát [452] ajánljuk. letöltheto  szótáA csatornakapacitás deníciója megtalálható például az Interneten is elérheto rakban [217, 489]. Az információ- és kódelmélettel kapcsolatos részletek megtalálhatók például Jones és Jones könyvében [234].  A hosszú távú függoséggel foglalkoznak például Taqqu és társai [287, 460].  A hálózatmodellezésben eloforduló leggyakoribb eloszlások becsléseit leíró 5.1. ábra  [29] származik. Banks, Carson és Nelson könyvébol  a [356]-ben megadott címrol.  Az OPNET szoftver és annak dokumentációja letöltheto Ez a dokumentáció részletesen tárgyalja a szimuláció egyes szakaszait is. A forgalom ingadozásának hatását Gyires Tibor cikke [184] alapján elemeztük.  számolnak be Leland és társai [285, A hálózati forgalommal kapcsolatos mérésekrol 286], valamint Crovella és Bestavros [94]. Hálózatok önhasonlóságával foglalkoznak Erramilli, Narayan és Willinger [121], Willinger és társai [497], valamint Beran [42]. Mandelbrot [307], Paxson és Floyd [363], vala folyamatokat. mint Mandelbrot és van Ness [308] tanulmányozták a hosszú távon függo  muvekben: Forgalomirányítási modellek találhatók például a következo  [17, 199, 227, 320, 347, 348, 359, 497]. Forgalmi adatokat tartalmaz [43, 114, 181, 363]. Az 5.22. ábra Listanti és Eramo cik [292] származik. kébol  A hosszútávú függoséget elemzi Addie, Zukerman és Neame [3], Duffield és O'Connell [113], valamint Erramilli, Narayan és Willinger [121]. A fekete doboz modellezés kifejezést Willinger és Paxson [495] vezette be 1997-ben.  például Francis Heylighen honlapja [206] tartalmaz Az Ockham borotvája nevu  elvrol  a Network Associates cég honlapján [316] találhatók további részleadatokat. A Snifferrol tek. Willinger, Taqqu, Sherman és Wilson [496] egy szerkezeti modellt elemeznek. Crovella és Bestavros [94] a World Wide Web forgalmát elemezték.  ingadozásnak a hálózati torlódásokra gyakorolt hatásával foglakozott például Az eros Neuts [347], valamint Molnár Sándor, Vidács Attila és Nilsson [335]. A Hurst-paraméter hatását elemzi Addie, Zukerman és Neame [3].  a hálózatról [468]. A Benoit-csomag letöltheto A Pareto-modellt vizsgálta Addie, Zukerman és Neame [3].

6. Párhuzamos számítások

1

 célja, hogy a feladatokat több processzor A folyamatos szintjén párhuzamos számítások fo segítségével gyorsabban oldjuk meg, mint egy processzoron. Ezek a processzorok tartozhat számítógépekhez, amelyek egy hálózaton kenak egyetlen számítógéphez vagy különbözo resztül kommunikálnak. A párhuzamos végrehajthatósághoz mindkét esetben szükség van arra, hogy a feladatot egyidejuleg  megoldható alfeladatokra osszuk.   párhuzamos száBár a párhuzamos számítások története korábban kezdodött, az elso mítógépnek a 64 processzort tartalmazó ILLIAC IV-et szokták tekinteni, amely 1972-ben  kezdett muködni.  A párhuzamos számítógépek a nyolcvan évek végén indultak gyors fejlo párhuzamos számítógépek gyártására. désnek, amikor is több új céget alapítottak különbözo  Sajnos abban az idoben nehezen indult el a szoftver fejlesztése és a kifejlesztett szoftver nem volt hordozható. Ezért a párhuzamos számítógépeket csak a tudományos és muszaki  élet leginkább számításigényes területein alkalmazták, mivel a piac túl kicsi volt ahhoz,  fejlesztési költségeket meg tudja zetni. Ezért számos cég abba is hagyta a hogy a jelentos fejlesztést. A dolog pozitív oldala volt az a felismerés, hogy olcsó párhuzamos számítógépek hozhatók létre az elterjedt személyi számítógépek vagy munkaállomások összekapcsolásával. Ahogy a hálózatok gyorsabbá váltak, ezek az úgynevezett klaszterek rövidesen ugyanolyan nagyságrendu  sebességet értek el, mint a speciális célú gépek. Jelenleg a világ 500 legnagyobb számítógépének folyamatosan frissített listáján a gépek 42 százaléka klaszter. A párhuzamos számítások eszköztárát gyarapítják azok a multiprocesszoros gépek is, amelyeket ugyan a web és más területek kiszolgálására terveztek, de párhuzamos számítások elvégzésére is alkalmasak. Végül a szoftver hordozhatóságával kapcsolatos problémák is megoldódtak a párhuzamos programozás széles körben elterjesztett szabványai segítségével. A két legfontosabb szabvány az MPI és OpenMP – ezeket a 6.3. alfejezetben fogjuk ismertetni. Összegezve, jelenleg elfogadható költségu  hardverbázis áll rendelkezésre. A terület  azonban még nem érte el fejlodési határait, mivel a párhuzamos szoftver fejlesztése ko egy algoritmust moly nehézségeket okoz. Míg egy soros program megírásához elegendo találni, azaz elemi muveleteknek  az adott feladatot megoldó sorozatát, majd az algoritmust egy programozási nyelven leírni, addig a párhuzamos számítások további kihívásokat jelentenek:

1

Párhuzamos számítás több szinten valósítható meg, így utasítás-szinten, szál-szinten és folyamat-szinten. Ez a  fejezet elsodlegesen a folyamat szintu  párhuzamos feldolgozással foglalkozik. A lektor.

6. Párhuzamos számítások



223

Az elemi muveleteket  olyan taszkokká kell csoportosítani, melyek párhuzamosan megoldhatók.



A taszkokat ütemezni kell a processzorokra.



 Az adatokat az architektúrától függoen el kell osztani a memóriamodulok között.



A folyamatokat és szálakat kezelni kell, azaz elindítani, megállítani és így tovább. A kommunikációt és a szinkronizációt meg kell szervezni. Természetesen nem elég a muveletek  csoportosítását, az ütemezést és így tovább meg-

oldani – olyan megoldásokat kell találni, amelyek gyors programokhoz vezetnek. A teljesítménymértékeket és a teljesítmény optimalizálásának módszereit a 6.2. alfejezetben tár párhuzamos gyaljuk, ahol a fent említett feladatok megoldását is vizsgáljuk. A különbözo  eltéroen   algoarchitektúrák és programozási modellek – a soros modellektol – különbözo  ritmusokat részesítenek elonyben. Ennek következtében a párhuzamos algoritmusok bonyolultabbak, mint a sorosak. A párhuzamos algoritmusok vizsgálatához gyakran alkalmaznak egyszerusített  modelleket. Például a népszeru  PRAM (lásd a 6.4. alfejezetet) modell nem veszi gyelembe a kommunikációs és szinkronizálási költségeket. Hasonlítsuk össze a párhuzamos számításokat az osztott és a konkurens számításokkal. Az osztott számítások összekapcsolt processzorokat használnak és a megoldandó problémá lehetnek. Míg a párhukat kisebb részfeladatokra osztják, de a felosztás céljai különbözok zamos számításoknál a részfeladatok egyidejuleg  oldódnak meg, az osztott számításoknál a részfeladatok különbözo  helyeken oldódnak meg, különbözo  eroforrásokat  felhasználva. Ezek a tulajdonságok átfedhetik egymást, ezért számos alkalmazás egyszerre párhuzamos  A párhuzamos számításoknál a felépítés homogén, és osztott, a lényeg azonban különbözo.  és a focél a számítások gyorsabb elvégzése, az osztott számításoknál a felépítés heterogén  a különbözo  eroforrások  és az alkalmazások számára gyakran kedvezo összekapcsolása. A párhuzamos rendszerek általában hosszabb ideig léteznek és kiszámíthatók, míg az osztott  állnak, melyek a futás során kapcsolódtak össze. alkalmazások olyan elemekbol A konkurens számítások nem feltétlenül igényelnek több processzort, és azt a körülményt emelik ki, hogy egyidejuleg  több részszámítás van folyamatban. Ez a fontos tulajdon ság garantálja, hogy az eredmény a részszámítások tetszoleges sorrendje és átfedése mellett is helyes lesz. Ezért a párhuzamosság és a konkurencia viszonya ahhoz hasonlítható, hogy egyidejuleg  több könyvet olvasunk (ami a gyakorlatban valószínuleg  nem oldható meg). Így a konkurens számítás vagy párhuzamos, vagy nem párhuzamos, a párhuzamos számítás viszont mindig konkurens. Egyetlen kivétel az adatok párhuzamossága, melyben egyetlen  adatokra. Ezt a megközelítést program utasításait alkalmazzuk párhuzamosan különbözo követi a SIMD architektúra.  A nagy sebességnek köszönhetoen a párhuzamos számítások tipikus alkalmazási területei a természettudományok és a muszaki  feladatok megoldása, különösen a numerikus számítások és a szimuláció. Ezeknek az alkalmazásoknak egyre nagyobb a számítási igénye, mivel a nagyobb számítási kapacitás részletesebb modellek alkalmazását és így pontosabb   eredmények elérését teszi lehetové. A párhuzamos számítások másik elonye a nagyobb me móriakapacitás, ami lehetové teszi, hogy több adatot tároljunk az olyan memóriaszinteken, mint a gyorsítótár.  Az 6.1. címu  alfejezetben röviden A fejezet további részének felépítése a következo. áttekintjük és osztályozzuk a jelenlegi párhuzamos architektúrákat. Azután a 6.2. alfejezet-

224

6. Párhuzamos számítások

ben olyan alapfogalmakat vezetünk be, mint a taszk és a folyamat, majd elemezzük a hatékonysági mértékeket és a hatékonyság javítására szolgáló általános módszereket. Ezután  a 6.3. alfejezet a párhuzamos programozás modelljeit ismerteti, elsosorban a népszeru  MPI  és OpenMP szabványokra koncentrálva. Erre a gyakorlati alapra épül a fejezet hátralévo része, amely formalizált módon tárgyalja a legegyszerubb  párhuzamos algoritmusokat és  tervezési módszereket. A soros algoritmusoktól eltéroen a párhuzamos algoritmusok esetén nincs általánosan elfogadott tervezési és elemzési módszer, bár számos modellt javasoltak erre a célra. A modellek mindegyike bizonyos kompromisszumot valósít meg az egymásnak ellentmondó célok – nevezetesen a valódi architektúrák pontos tükrözése és a tervezés,  a 6.5. valamint elemzés egyszerusége  – között. A 6.4. alfejezet áttekintést ad a modellekrol, alfejezet pedig konkrét algoritmusokat mutat be – többek között a kiválasztás, összefésülés és rendezés feladatok megoldására. Az algoritmusok elemzése során mindvégig nagy gyelmet fordítunk az adott feladat soros és párhuzamos megoldási idejének, valamint a kétféle megoldás során végzett munkának az összehasonlítására. Az algoritmusok elemzésének korszeru  felfogását követve nem  korlátjával, hanem leelégszünk meg a vizsgált hatékonysági mérték értékének egy felso   és a végzett munka hetoleg pontosan jellemezzük a legrosszabb esetben várható futási ido nagyságrendjét.

6.1. Párhuzamos architektúrák A párhuzamos architektúrák egyik egyszeru  és közismert osztályozását Flynn javasolta. A számítógépeket négy osztályba sorolta: SISD, SIMD, MISD, és MIMD architektúrák.



SI egyszeres utasításáramot (Simple Instruction stream) jelent, azaz egyidejuleg  egyetlen utasítás hajtódhat végre.



 proMI többszörös utasításáramot (Multiple Instruction stream) jelent, azaz különbözo



SD egyszeres adatáramot (Simple Data stream) jelent, azaz egyidejuleg  egyetlen adattal

 utasításokat is végrehajthatnak. cesszorok egyidejuleg  különbözo

hajtódhatnak végre muveletek. 



 MD többszörös adatáramot (Multiple Data stream) jelent, azaz egyidejuleg  különbözo  muveletek. adatokkal is végezhetok 

A SISM felépítés a Neumann-elvu  számítógépeket jelenti. MISD típusú számítógépeket valószínuleg  sohasem építettek. A korai számítógépek SIMD felépítésuek  voltak, ma a legtöbb párhuzamos számítógép MIMD felépítésu.  Bár ennek a sémának kicsi az osztályozási ereje, mégis széles körben alkalmazzák.  osztályozás a párhuzamos gépeket a SIMD, SMP, ccNUMA, nccNUMA, A következo NORMA, clusters, és rács osztályokba sorolja. SIMD architektúrák  pro vezérlo Amint azt a 6.1. ábra mutatja, a SIMD számítógép egy nagyteljesítményu  áll. A feldolgozó egységeket cesszorból és több, kisebb teljesítményu  feldolgozó elembol gyakran rácsszeruen  kötik össze úgy, hogy minden egység a közvetlen szomszédaival kom processzor – a soros gépek processzorához hasonlóan – egymás után olmunikál. A vezérlo

225

6.1. Párhuzamos architektúrák

Vez´erl˝o Egys´eg M P M

P M

P M

P M

P M

P M

P M

P M

P M

P M

P M

P M

P M

P M

P M

P M

6.1. ábra. SIMD architektúra.

vassa és dekódolja az utasításokat. A soros esetben a processzor a beolvasott utasítást a saját  adatokkal hajtja végre. A párhuzamos esetben a vezérlo  processzor minmemóriájában lévo den feldolgozó egységhez elküldi a beolvasott utasítást és azok egyidejuleg  hajtják végre ezt az utasítást a saját memóriájukban tárolt adatokon. Példaként tekintsük az

LD reg, 100 utasí-

tást. Ennek hatására minden processzor betölti a 100-as memóriacím tartalmát a regiszterbe,  memóriarekeszt jelent. Tehát a processzorok de a 100-as cím processzoronként különbözo   adatokkal. – a SIMD felépítésnek megfeleloen – azonos utasítást hajtanak végre különbözo Az

if

test

then

if_branch

else

else_branch,

utasítás hatására a processzorok egyidejuleg  elvégzik a tesztelést, azután egy részük az  if_branch ágon folytatja, míg mások tétlenek maradnak, és végül az elobbiek maradnak tétlenek és az utóbbiak végzik el az else_branch ágat. Emiatt a SIMD felépítésu  számítógépek szabályos szerkezetu  számítások elvégzésére alkalmasak. Ez a felépítés történetileg lényeges, de ma már nem alkalmazzák. Szimmetrikus multiprocesszorok A szimmetrikus multiprocesszorok (SMP) egy közös memóriához kapcsolódó processzorokat tartalmaznak. A hardver minden processzornak hozzáférést biztosít – a szokásos betölt/tárol muveletekkel  – minden memóriarekeszhez. Ezért a programokat – beleértve az operációs rendszert is – elég egy példányban tárolni. A memória zikailag modulokra bont azonos minden processzor-modul párra (ez indokolja a szimható, de a hozzáférési ido  metrikus jelzot). A processzorokat egy adatátviteli vonal, egy mátrix-kapcsoló vagy egy kapcsolóhálózat köti össze a memóriával (lásd 6.2. ábra). A memóriához való hozzáférés  mindegyik esetben késleltetéssel történik, ami részben a hálózati eroforrásokért folyó ver seny következménye, és a processzorok számával no. Minden processzornak egy- vagy többszintes gyors hozzáférésu  gyorsítótára is van. A  memória és a gyorsítótár között az adatok a gyorsító adatátviteli vonalakon mozognak. Ha fo az egyes adatelemeket több gyorsítótárban is tároljuk, akkor koherenciaproblémák lépnek fel. Például rossz megosztásról beszélünk, ha több processzor is hozzáfér ugyanahhoz a  részét használják. gyorsítóvonalhoz, de annak különbözo

226

6. Párhuzamos számítások

P

P

P

P

C

C

C

C

M

M

Busz M

M

6.2. ábra. Busz-alapú SMP-architektúra.

M

M

M

C

C

C

P

P

P

M

···

C P

¨ Osszek¨ ot˝o H´al´ozat

6.3. ábra. ccNUMA architektúra.

Gyorsítótáras NUMA architektúrák

Leopold/Parallel/Fig. 02.07 memóriahozzáférés) nem egységes A ccNUMA (gyorsítótárral koherens nem-egyenletes  o  osztály szimmetrikus hozzáférésével. A 6.3. memóriahozzáférést jelent, ellentétben az eloz ábra mutatja ezeknek a számítógépeknek a felépítését. Az ábra szerint minden processzorhoz tartozik egy helyi memória (gyorsítótár), amelyhez a hozzáférés gyorsabb, mint a memória további, távoli memóriának nevezett részéhez.  /tároló muveletekkel A teljes memóriához szabványos betölto  férhetünk hozzá, ezért a programokat – az operációs rendszerek programjait is – csak egyszer kell tárolni. Az SMP-khez hasonlóan minden processzornak egy vagy többszintes gyorsítótára van; a gyorsítótár szintjeinek összhangját a hardver biztosítja. Gyorsítótár nélküli NUMA architektúrák Az nccNUMA architektúrák abban különböznek a ccNUMA architektúráktól, hogy a hardver csak a helyi memóriából származó adatokat tölti be a gyorsítótárba. A távoli memóri ához való hozzáférés a szokásos beviteli/kiviteli muveletekkel  megvalósítható, de eloször  lapot a helyi memóriába töltenie. Ez a különbség az operációs rendszernek kell a megfelelo egyszerusíti  a hardver tervezését, és ezért az nccNUMA felépítésu  gépek több processzort tartalmaznak. Hátrány viszont, hogy az operációs rendszer bonyolultabb, a távoli memóriához való hozzáférés ideje nagyobb. A 6.3. ábrán bemutatott felépítés az nccNUMA típusú számítógépekre is vonatkozik. Távoli memóriához való gyors hozzáférés nélküli architektúrák A NORMA (NO Remote Memory Access Architectures) architektúra abban különbözik az

6.2. Hatékonysági mértékek és optimalizálás

227

 o  osztálytól, hogy a távoli memóriához lassú beviteli/kiviteli muveletekkel eloz  lehet hozzá o  osztály betölto  /tároló muveleteivel. férni, szemben az eloz  Amint azt a 6.3. ábra mutatja, minden csúcs egy processzorból, gyorsító memóriából és helyi memóriából áll, tartalmazza az operációs rendszer egy saját példányát, vagy legalább annak központi részét. Míg az SMP, ccNUMA és nccNUMA architektúrákat rendszerint a közös memóriájú gépekhez sorolják, a NORMA típusú gépeket, klasztereket és grideket az osztott memóriájúakhoz. Klaszterek A klaszter olyan párhuzamos vagy osztott számítógéprendszer, amely egységes felépítésu,   áll. A számítógép itt személyi számítógépet, munegymással összekötött számítógépekbol kaállomást vagy – egyre gyakrabban – szimmetrikus multiprocesszort jelent, azaz olyan hálózati elemet, amely processzorból (vagy processzorokból), memóriából, esetleg perifé áll. Az egységes feldolgozó elemekbol  álló rendszert SSI riákból és operációs rendszerbol tulajdonságúnak (Single System Image) mondjuk, ha csak a rendszerbe lehet bejelentkezni, az egyes elemekre nem – vagy ha egyetlen fájlrendszer van. Természetesen az SSI tulajdonság fokozatos, ezért a határvonal az osztott rendszerek és klaszterek között nem éles. A NORMA rendszerek és klaszterek közötti határvonal is bizonytalan, mivel attól is függ,  eredetileg különálló komponenseket hogy eleve egységes rendszert terveztek vagy meglévo, kapcsoltak össze. A klaszterek osztályozhatók aszerint, hogy párhuzamos számításokra, nagyméretu  szá  mításokra vagy széles köru  hozzáférhetoségre alkalmazzák-e oket. A párhuzamos számításokra használt klaszterek tovább oszthatók a kiemelt klaszterekre, melyeket eleve úgy terveztek, hogy párhuzamos gépekként üzemeljenek, vagy kampus-klaszterekre, amelyek az  egy részében párhuzamos gépekként alkalmazott osztott rendszerek. A dedikált klaszteido rek elemei rendszerint nem rendelkeznek perifériákkal és nagy sebességu  hálózati vonalakkal vannak összekötve. A kampusz-klaszterek viszont gyakran asztali személyi számítógé kommunikáció közönséges hálózati vonalak segítségével valósul pek, melyek között a belso meg. Gridek  A grid egy hardver/szoftver infrastruktúra az eroforrások kö”   zös használatához és a problémák megoldásához”. A gridek lehetové teszik az olyan erofor-

Foster és Kesselman szerint

rásokhoz való összehangolt hozzáférést, mint a processzorok, memóriák, adatok, perifériák stb. A gridek abban különböznek a párhuzamos számítási architektúrától, hogy nagyok, heterogének és dinamikusan változnak. A gridek vezérlése ezért bonyolult feladat.

6.2. Hatékonysági mértékek és optimalizálás  Ebben az alfejezetben eloször a gyakorlatban használt hatékonysági mértékeket és optimalizálási módszereket, azután pedig az algoritmusok aszimptotikus elemzésénél felhasználható fogalmakat tekintjük át.

228

6. Párhuzamos számítások

6.2.1. Hatékonyság a gyakorlatban Amint azt a bevezetésben leírtuk, a párhuzamos számítások során a feladatokat taszkokra bontjuk és a taszkokat egymástól függetlenül megoldjuk. A taszkokat folyamatokként vagy  programok. szálakként valósítjuk meg. Más szavakkal, a folyamatok végrehajtás alatt lévo  Minden folyamattal kapcsolatban tárolunk olyan eroforrásokkal kapcsolatos adatokat, mint a memóriaszegmensek, fájlok és jelek, míg a szálak a folyamatokon belül léteznek és a  többszörös szálak megosztják egymás között az eroforrásokat. Adott folyamat szálai hozzáférnek a közös memóriához, míg a folyamatok rendszerint üzenetekkel kommunikálnak. Minden szálnak van egy utasításszámlálója vagy más regiszterértéke, valamint egy verme   egya helyi változók tárolására. A folyamatokat tekinthetjük az eroforráshasználatot segíto  egységnek. ségnek, míg a szálakat a központi feldolgozó egységen való végrehajtást segíto Mivel kevesebb információ tárolására van szükség, gyorsabban lehet szálakat létrehozni, megszüntetni és egyik szálról a másikra átkapcsolni, mint ugyanezeket a muveleteket  folyamatokkal elvégezni. Az architektúrától függ, hogy szálakat vagy folyamatokat alkalmazunk-e. A közös memóriájú gépeken a szálak rendszerint gyorsabban futtathatók, ugyanakkor viszont a folyamatokat felhasználhatjuk a programok hordozhatóságának biztosítására. A szálak alkalmazhatók, ha van egy szoftver réteg (osztott közös memória), amely megvalósítja a közös memória absztrakcióját, de ezeknek a szálaknak nagyobbak a kommunikációs költségei. Míg a taszkok fogalma a problémákhoz kapcsolódik, a folyamatok és szálak fogalma a  megvalósításhoz kötodik. Amikor egy algoritmust tervezünk, rendszerint nagyszámú taszkot azonosítunk, amelyek potenciálisan futhatnak párhuzamosan, majd ezek közül többet ugyanarra a folyamatra vagy szálra képezünk le. Párhuzamos programok két stílusban írhatók és ezek a stílusok keveredhetnek: az egyik  azaz ugyanazt a muveletet  stílusra adatpárhuzamosság jellemzo,  egyidejuleg  különbözo adatokra alkalmazzuk. Ez a muvelet  lehet egy gépi utasítás, mint a SIMD architektúrákban,  vagy egy összetett muvelet,  például egy függvény alkalmazása. Utóbbi esetben különbözo  muveleteket  processzorok különbözo  hajtanak végre. A másik stílus jellemzoje a taszk taszkokat hajtanak végre. Mivel egy párhuzamosság, azaz a folyamatok/szálak különbözo  konstrukcióként tartalmazhat például if vagy case parancsot, az adatpárhufüggvény külso zamosság és taszkpárhuzamosság közti határvonal nem éles. A folyamatok segítségével megvalósított párhuzamos programok tovább osztályozhatók: az SPMD (Single Program Multiple Data) programozási stílus azt jelenti, hogy minden folyamat ugyanazt a programot futtatja, míg az MPMD (Multiple Program Multiple Data)  programokat futtatnak. Az MPMD prograstílus alkalmazásakor a folyamatok különbözo mok taszkpárhuzamosak, míg az SPMD programok mind taszkpárhuzamosak, mind pedig adatpárhuzamosak lehetnek. SPMD módban a taszkpárhuzamosságot feltételes utasítások segítségével fejezzük ki.  Mivel a párhuzamos számítások elsodleges célja a programok gyors futtatása, a teljesítménymértékek fontos szerepet játszanak ezen a területen. Természetes abszolút mérték  de még gyakrabban használnak egy relatív mértéket, a gyorsítást. Adott a végrehajtási ido, problémára a gyorsítást a gyorsítás( p)

= T 1 /T p

hányadossal deniáljuk, ahol T 1 a leggyorsabb ismert soros algoritmus futási ideje p pro függoen  cesszoron. A környezettol a gyorsítás vonatkozhat p folyamat vagy p szál alkalma-

229

6.2. Hatékonysági mértékek és optimalizálás

gyors´ıt´as line´aris gyors´ıt´as szuperline´aris gyors´ıt´as tipikus gyors´ıt´as

P 6.4. ábra. Ideális, tipikus és szuperlineáris gyorsítási görbék.

zására is. A gyorsítással kapcsolatos, de ritkábban használt mérték a hatékonyság, melyet a hatékonyság( p)

= gyorsítás( p)/ p

összefüggéssel deniálunk.  a deníciótól függetlenül a hatékonyságot a jó teljesítmény szinonimájaként is Ettol használják. A 6.4. ábra bemutatja az ideális, tipikus és szuperlineáris gyorsítási görbéket. Az ideális görbe azt a feltevést tükrözi, hogy ha a processzorok számát megkétszerezzük, akkor a  felére csökken. Ezért az ideális gyorsítás egységnyi hatékonyságnak felel végrehajtási ido   azaz akkor, ha meg. A szuperlineáris gyorsítás a gyorsításnak köszönhetoen fordulhat elo, a több processzor alkalmazása megnöveli a gyorsítótár méretét, és így több adathozzáférés szolgálható ki a gyorsítótárból – ahelyett, hogy a lassú központi memóriához kellene fordulni. A tipikus gyorsítás az ideális gyorsításnál kisebb és csak bizonyos processzorszámig  Emellett több processzor alkalmazása lassítja a programot. A tipikus és ideális gyorsítás no. közötti különbségnek több oka van:



Amdahl törvénye azt mondja, hogy minden programnak van egy s soros hányada, amely nem párhuzamosítható. Ezért T p

>

s, és így gyorsítás( p)

<

T 1 / s, azaz a gyorsí-

tás mindig kisebb, mint egy konstans érték. Szerencsére egy másik gyakorlati meggyelés, a Gustafson–Barsis-törvény csökkenti az Amdahl-törvény gyakorlati szerepét. A Gustafson-Barsis-törvény szerint a tipikus alkalmazásokban a párhuzamos algoritmus alkalmazása nem korlátozódik egy rögzített méretu  probléma megoldására, hanem  egyre nagyobb méretu  feladatokat oldunk meg. Ebben az esetben s lassabban nohet, mint T 1 , és így T 1 / s már nem konstans.



A taszkkezelés, azaz a taszkok indítása, megállítása, megszakítása, valamint a folyamatok és szálak ütemezése bizonyos többletterhelést okoz. Továbbá az is rendszerint  munkát nem lehet egyenletesen elosztani a folyamatok/szálak igaz, hogy az elvégzendo között.



A kommunikáció és a szinkronizáció lassítja a programot. A kommunikáció az adatcserét jelenti, míg a szinkronizáció más típusú koordinációt jelent, például a kölcsönös kizárás biztosítását. A kommunikációs és szinkronizációs költségek még a nagy  hálózatokban is nagyságrendileg nagyobbak, mint a sebességu  vonalakkal rendelkezo számítási költségek. Ennek oka a zikai átviteli költségek mellett a protokoll számítási  többletigénye és a hálózati eroforrásokért való versenyzés okozta késedelem.

230

6. Párhuzamos számítások

 hatásának minimalizálásával a teljesítmény javítható. Amdahl törvéA fenti tényezok nyét nehéz megkerülni, kivéve azt az esetet, ha új algoritmust tudunk tervezni, amelyre nézve s értéke kisebb – esetleg olyan áron, hogy T 1 értéke nagyobb lesz. Az algoritmikus   fogalmakat késobb tekintjük át – most a gyakorlatban használt jellemzoket mutatjuk be. Amint korábban láttuk, a taszkokat olyan folyamatokként vagy szálakként valósítjuk meg, amelyek rendszerint többszörös taszkokra vonatkoznak. A nagyobb teljesítmény ér dekében a folyamatok/szálak szemcsézettségét az architektúrának megfeleloen választjuk meg. Sok folyamat/szál szükségtelenül megnöveli a taszkkezelési költségeket, míg kevés folyamat/szál a számítógép alacsony kihasználtságát eredményezi. Ezért célszeru  több folyamatot/szálat ugyanahhoz a processzorhoz rendelni, mivel így a processzorok átkapcsolhatnak, amikor bevitel/kivitel vagy más ok miatt várakozniuk kellene. A nagy szemcséju   folyamatok/szálak elonye a jobb kommunikáció/számítások arány, míg a nomabb szemcséju  folyamatok/szálak alkalmasabbak a terhelés egyenletes elosztására.  statikus vagy dinamikus módon. Ha a taszkok futási A terheléskiegyenlítés végezheto   akkor a statikus sémákat részesítjük elonyben.  ideje elore megbecsülheto, Ezeknél a módszereknél a programozó minden folyamathoz/szálhoz hozzárendel bizonyos számú folyamatot/szálat úgy, hogy az összköltség minden processzoron hasonló nagyságú legyen. A  dinamikus megoldásra példa a mester-szolga séma. Ebben a sémában eloször a mester folyamat hozzárendel minden processzorhoz egy folyamatot. Ezután valahányszor egy szolga  a mestert és az új taszkot rendel a processzorhoz mindbefejez egy taszkot, értesíti errol addig, amíg minden taszk végre nem hajtódik. Ez a séma jó terheléskiegyenlítést biztosít, aminek az ára a taszkkezelés okozta többletterhelés. A hatékonyság növelésének legjobb eszköze rendszerint a kommunikációs/szink el az architektúra vagy a ronizációs költségek csökkentése. Természetesen javulás érheto  adatra rendszerszoftver változtatásával, például a késleltetésnek – azaz a távolról érkezo  várás idejének – csökkentésével, vagy a sávszélesség – azaz az idoegység alatt átvitt adatmennyiség – növelésével.  vagy felhasználói programozó csökkentheti a kommunikáAz algoritmustervezo ciós/szinkronizációs költségeket a beavatkozások számának csökkentésével. Az egyik fontos megközelítés ennek a minimalizálásnak az elvégzésére a helyi optimalizálás. A lokalitás a (soros vagy párhuzamos) programok olyan tulajdonsága, amely tükrözi az azonos ada tokhoz idoben vagy térben koncentrálva való hozzáférés mértékét. Az osztott memóriájú architektúrákban például az adatokat annál a processzornál célszeru  tárolni, ahol felhasz  náljuk oket. A lokalitás javítható kódtranszformációval, adattranszformációval vagy a ketto  programrészlet végrehajtását három prokombinációjával. Például tekintsük a következo cesszoron:

for (i=0; i k/g. Ha van a két szekvenciának

azokat a di, j mátrix elemeket számolja ki, amelyekre (i − j) a határelemek azon de, f

551

13.1. Algoritmusok szekvenciákon

legfeljebb k súlyú illesztése, akkor dn,m  esetben dn,m lenkezo

>



k, és dn,m valóban a szekvenciák távolsága, el-

k. Ez utóbbi esetben dn,m nem feltétlenül a szekvenciák távolsága:

 hogy van olyan illesztés, amelyre az ezt meghatározó út kilép az |i elképzelheto,

− j| ≤ k/g

 egyenlotlenség által deniált sávból, és az illesztés súlya mégis kisebb, mint a meghatározott sávban haladó legkisebb súlyú illesztés. A sarokvágási technikát kiterjesztették olyan többszörös illesztésekre is, ahol egy illesztett k-ast a páronkénti összeg sémával értékelünk, azaz

S Pl

=

k−1 X k X

d( pi,l , p j,l )

,

(13.37)

i=1 j=i+1

ahol S Pl az l-edik illesztett k-as értékelése, d(, ) a

Σ ∪ {−} halmazon deniált távolságfügg-

vény, k az illesztett szekvenciák száma, pi, j pedig a prol i-edik sorának j-edik eleme. Egy szekvencia l-szuffixe az (l

 a szekvencia végéig terjedo  részstring. Jelöljük + 1)-edik betut  ol

wi, j (l, m)-lel az i-edik és a j-edik szekvencia l- illetve m-szuffixének a távolságát. Carillo és Lipman algoritmusa csak azokat a pozíciókat számolja ki, amelyekre

di1 ,i2 ,...in

+

k−1 X k X

j= 1

w j,l (i j , il )

≤t,

(13.38)

l= j

ahol t a teszt érték. Az algoritmus helyességét az bizonyítja, hogy a szekvenciák még nem illesztett szuffixeinek a páronkénti összeg sémával adott optimális illesztésének a súlya nem  adódó súlyok összege. A wi, j (l, m)-ek a páronlehet kisebb, mint a páronkénti illesztésbol  számíthatók, így az algoritmus a gyakorlat számára elfogadható ido  alatt kénti illesztésekbol ki tudja számolni hat darab 200 hosszúságú szekvencia optimális illesztését.

Gyakorlatok 13.1-1. Mutassuk meg, hogy egy n és egy m hosszúságú szekvencia esetén a lehetséges illesztések száma

X

min(n,m)

i=0

+ m − i)! . − i)!(m − i)!i!

(n (n

13.1-2. Adjunk meg egy olyan értékelést és szekvenciák olyan sorozatát, amelyekre az op a szekvenciák hosszával. timális illesztések száma exponenciálisan no 13.1-3. Adjuk meg Hirschberg algoritmusát többszörös szekvenciaillesztésre.  függvények esetén. 13.1-4. Adjuk meg Hirschberg algoritmusát affin résbünteto 13.1-5. Adjuk meg a Smith–Waterman algoritmust affin résbüntetésekre. 13.1-6. Adjuk meg a Spouge-féle saroklevágási technikát affin résbüntetésekre.  levezetett páronkénti illesztése 13.1-7. Két szekvenciának egy többszörös illesztésükbol  kivágjuk a többszörös illesztésbol  a két szekvenciára vonatkozó sort, ezeket a következo: egymás alá írjuk, majd elhagyjuk a csupa rést tartalmazó sorokat. Adjunk példát három  valamelyik két szekvenciára levezetett pászekvencia olyan optimális illesztésére, melybol ronkénti illesztés nem a két szekvencia optimális páronkénti illesztése.

552

13. Bioinformatika

13.2. Algoritmusok fákon  algoritmusok gyökereztetett fákon dolgoznak. A dinamikus Az alább ismertetésre kerülo  visszavezetéssel történik. Mint látni fogjuk, programozás a gyökereztetett részfákon történo  alatt algebrai nem csak optimális eseteket határozhatunk meg, hanem ugyanakkora futási ido kifejezéseket is meghatározhatunk.

13.2.1. A takarékossági elv kis problémája A takarékossági (parszimónia) elv a biológiai szekvenciák változását minél kevesebb számú mutációval akarja leírni. Az alábbiakban csak cserékkel fogunk foglalkozni, azaz adottak  hosszú biológiai szekvenciák, és a feladat az, hogy adjuk meg a leszármazási kapegyenlo csolataikat a takarékossági elv alapján. Deniálhatjuk a takarékossági elv kis és nagy problémáját. A nagy problémában ismeretlen az evolúciós törzsfa topológiája, amely mentén a szekvenciák evolválódtak, a feladat ennek a topológiának a megkeresése, valamint ezen egy legtakarékosabb evolúciós történet megkeresése. Az így kapott megoldás tehát nem csak lokálisan – az adott topológiára nézve – lesz optimális, hanem globálisan is. Megmutatható, hogy a takarékossági elv nagy problémája NP-teljes probléma. A kis problémában adott egy gyökeres fa topológia, és a feladat az, hogy keressünk egy legtakarékosabb evolúciós történetet ezen fa mentén. Az így kapott megoldás lokálisan optimális lesz, de nincs garancia a globális optimumra nézve. A szekvenciák minden egyes pozíciójához egymástól függetlenül kereshetjük meg a legtakarékosabb történetet, így elég azt az esetet megoldani, amikor a fa minden egyes levelén csupán egy karakter van megadva.  csúcsaihoz rendelt karakterekkel jellemezEkkor egy evolúciós történetet a fa belso hetünk. Ha két szomszédos csúcson ugyanazt a karaktert látjuk, akkor a takarékossági elv  él mentén, egyébként meg egy mutáció alapján nem történt mutáció a két csúcsot összeköto történt. A naiv algoritmus végignézi az összes lehetséges hozzárendelést, ami nyílván lassú, hiszen a lehetséges címkézések száma exponenciálisan növekszik a fa leveleinek számával.  visszavezetéssel történik (Sankoff algoA dinamikus programozás a részfákon történo  csúcsot, mint györitmusa). Most részfán csak azokat a részfákat értjük, amelyek egy belso keret tartalmaznak, és minden olyan csúcsot, amely az adott gyökér alatt van. Így a részfák  csúcsok számával egyezik meg, és ezért egyértelmuen száma pontosan a belso  beszélhetünk egy adott pont által deniált részfáról. Feltesszük, hogy egy adott r gyökeru  részfa esetén ismerjük r minden t gyerekére és

ω

karakterre azt, hogy a t gyereke által deniált rész-

fán minimum hány mutáció szükséges, ha a t csúcsban számot mt,ω -val. Ekkor mr,ω

=

X t∈ D(r)

min{mt,σ

σ∈Σ

ω karakter található. Jelöljük ezt a

+ δω,σ } ,

(13.39)

ahol a D(r) r gyerekeinek a halmaza, Σ a lehetséges karakterek halmaza, δω,σ pedig 1 ha ω = σ és 0 egyébként. A (13.39) képlet helyessége abból adódik, hogy a megvizsgáltuk az  összes lehetoséget arra vonatkozóan, hogy r gyerekeihez milyen karaktereket rendelhetünk, és azt már ismerjük, hogy ezen karakterek hozzárendelésekor legalább mennyi szubsztitúció szükséges az adott gyerek alatti részfán. Az adott fa topológiájához szükséges mutációk száma minω∈Σ mR,ω , ahol R a fa gyö visszafelé haladva a minimális kere. Egy legtakarékosabb evolúciós történetet a gyökérbol  értékeket adó karakterek beírásával kaphatunk meg. Ehhez természetesen minden r belso

553

13.2. Algoritmusok fákon

csúcsra és

ω karakterre tárolni kell mr,ω -t.

A minimális mutációk számának meghatározásához a legtakarékosabb történet megkeresése

 Θ(n|Σ|2 ) idore van szükség, ezután

 vesz igénybe, ahol n a levelek száma. Θ(n|Σ|) idot  vesz igénybe, ahol l a szekvenciák Θ(nl|Σ|2 ) idot

A teljes evolúciós történet meghatározása hossza.

13.2.2. Felsenstein algoritmusa  adat DNS szekvenciák többszörös illesztése. Csak Felsenstein algoritmusában a bemeno azokat a pozíciókat tekintjük, ahol az illesztésben nincs rés. Feltesszük, hogy az egyes pozíciók egymástól függetlenül evolválódtak, így egy evolúciós folyamat valószínusége  az egyes csúcsokon történt események valószínuségeinek  a szorzata. Legyen adva egy fa topológiája, amely ábrázolja a szekvenciák leszármazási sorrendjét, valamint egy evolúciós modell, amely minden

σ

karakter

ω-vá

σ-ra, ω-ra és t-re megmondja, hogy mi annak a valószínusége,  hogy

 alatt. Ezt fσω (t) jelöli. Valamint ismerjük a karakterek evolválódik t ido

egyensúlyi eloszlását, amit

π

jelöl. A kérdés az, hogy mennyi a fa likelihoodja, azaz a fa

valószínusége  egy adott paraméterhalmaz mellett. Egy adott paraméterhalmaz mellett a fa likelihoodjának a kiszámítását egy adott fa topológiáján mutatjuk meg (13.1. ábra). Elég azt megmutatni, hogy hogyan kell a likelihoodot egy pozícióra kiszámítani, a fa teljes likelihoodja a pozíciók likelihoodjainak a szorzata. Az adott pozícióra si jelöli az i-edik csúcs  karakterét, v j pedig az j-edik él evolúciós ideje, pontosabban a mutációs ráta és az ido  pontok állapotait persze általában nem ismerjük, ezért minden lehetséges szorzata. A belso állapotra összegezni kell: L

XXXX

=

πs × 0

s0

s6

× fs

0 s8

s7

(v8 )

f s0 s6 (v6 )

×

f s6 s1 (v1 )

×

f s6 s2 (v2 )

s8

×

f s8 s3 (v3 )

×

f s8 s7 (v7 )

×

f s7 s4 (v4 )

×

f s7 s5 (v5 )

.

(13.40)

Ha négyelemu  ábécét, azaz nukleinsav szekvenciákat tételezünk fel, akkor az összegzés 256 n−1

tagból áll, n faj esetén pedig 4

tagból, ami könnyen lehet egy túl nagy szám. Szerencsére,

 szorzótényezoket  ha az adott változótól nem függo kihozzuk a szumma jel elé, akkor az összegzés felbomlik egy

L

=

X

   X πs    0

s0

   X ×  

f s0 s6 (v6 )[ f s6 s1 (v1 )][ f s6 s2

s6

f s0 s8 (v8 )[ f s8 s3

 X  (v3 )]  

s8

    (v2 )]  

f s8 s7 (v7 )[ f s7 s4 (v4 )][ f s7 s5

s7

    (v5 )]   

(13.41)

szorzatra, aminek a számítási igénye jóval kisebb. Vegyük észre, hogy a (13.41) egyenletben  és a zárójelezések pontosan leírják a fa topológiáját. Minden összegzés külön elvégezheto,  lecsökken ezeket az összegeket szorozzuk össze, így a számítási ido óra, a teljes fa likelihoodjának a kiszámítása

Θ(|Σ|

2

Θ(|Σ|2 n)-re egy pozíci-

nl)-re, ahol l a pozíciók száma.

Gyakorlatok 13.2-1. Adjunk algoritmust a súlyozott takarékossági elv kis problémájára, azaz amikor az egyes változásokat súlyozzuk, és a változások súlyainak az összegét akarjuk minimalizálni.

554

13. Bioinformatika 0

v8 8

v6

v3

6

v1

v7

3

v2

7

v4

v5

4

5

1 2

 jelölik. 13.1. ábra. A fa, amin Felsenstein algoritmusát bemutatjuk. Az élekre írt v-k az éleken eltelt evolúciós idot

13.2-2. Az egyes genomok géntartalma különbözik, egy adott faj valamely génje egy másik fajból hiányozhat. A géntartalom változására a legegyszerubb  modell az, amelyben két  mutációt különböztetünk meg: egy gén törlodik egy genomból vagy egy gén megjelenik a genomban. Adott néhány faj géntartalma, valamint az ezen fajok leszármazását bemutató törzsfa. Adjuk meg azt az evolúciós történetet, amely minimális számú mutációval írja le az adott fajok evolúcióját. 13.2-3. Adott szekvenciákra és törzsfára adjuk meg a Maximum Likelihood evolúciós tör csúcsain azokat a szekvenciákat, amelyre a likelihood maximális. ténetet, azaz a fa belso 13.2-4. Írjuk fel a takarékossági elv kis problémáját a (13.40) képlethez hasonló alakban (csak az összegzések helyett minimumok szerepeljenek), és mutassuk meg, hogy Sankoff algoritmusa tulajdonképpen Felsenstein algoritmusához hasonló átrendezésen alapszik.  13.2-5. Fitch algoritmusa a következoképen muködik.  Minden r csúcshoz hozzárendelünk egy karakterhalmazt, C r -t, a levelekhez egyelemu  halmazokat, amelyek az adott levélen ta csúcshoz pedig lálható karaktert tartalmazzák, minden r belso

∩t∈D(r) Ct , ∪t∈D(r)Ct

ha

∩t∈D(r) Ct , ∅ , egyébként .

 Miután elértünk a gyökérhez, a gyökérhez rendelt halmazból tetszolegesen kiválasztunk  csúcsból kiválasztjuk ugyanazt a egy karaktert, majd lefelé haladva minden egyes belso  csúcshoz rendeltünk, amennyiben szerepel ez a karakter karaktert, mint amit a felette levo  az adott halmazban, egyébként egy tetszoleges karaktert választunk. Mutassuk meg, hogy így egy legtakarékosabb történethez jutunk. Mennyi lesz ezen algoritmus futási ideje? 13.2-6. Mutassuk meg, hogy a 13.2.1. pontban megadott algoritmussal minden lehetséges legtakarékosabb evolúciós történetet megkaphatunk. Adjunk példát olyan legtakarékosabb történetre, amelyet Fitch algoritmusával nem kaphatunk meg.

13.3. Algoritmusok sztochasztikus nyelvtanokon Az alábbiakban generatív nyelvtanok sztochasztikus változataival fogunk foglalkozni. A sztochasztikus generatív nyelvtanok központi szerepet játszanak a modern bioinformatikában. Két nyelvtantípus terjedt el széles körben, a rejtett Markov-modellek leggyakoribb

555

13.3. Algoritmusok sztochasztikus nyelvtanokon

alkalmazási területei fehérjék térszerkezetének jóslása, illetve génkeresés, a sztochasztikus környezetfüggetlen nyelvtanok pedig az RNS molekulák másodlagos szerkezetének jóslásában játszanak fontos szerepet.

13.3.1. Rejtett Markov-modellek: el®re, hátra és Viterbi algoritmusa Az alábbiakban deniáljuk formálisan a rejtett Markov-folyamatokat. Legyen adva állapo és a végállapot. tok egy véges X halmaza. A halmazban van két kitüntetett elem, a kezdo  Az állapotokat két részhalmazra bontjuk, emittáló és nem-emittáló állapotokra. Egyelore  és a végállapot nem emittáló. Késobb  feltesszük, hogy csak a kezdo látni fogjuk, hogy ez a feltételezés nem túl szigorú (lásd 13.3-3. gyakorlat).  Megadunk egy M transzformációs mátrixot, melynek egy mi j eleme megadja az i-bol a j állapotba ugrás valószínuségét,  így értelemszeruen  a mátrix nem-negatív, és minden sor  összege 1 (teljes valószínuség  tétele). A végállapotra a mátrix nem tartalmaz sort, a kezdore oszlopot. Megadunk egy

Σ ábécét, és minden emittáló állapotra egy eloszlásfüggvényt az ábécé

elemein, amely megmondja, hogy az adott állapot mely valószínuséggel  melyik karaktert fogja emittálni amikor a folyamat az adott állapotban van. valószínuségét,  hogy az i állapot az

ω

πiω -vel

fogjuk jelölni annak a

karaktert emittálja, feltéve persze, hogy az i álla-

 (START ) állapotból indul, és a végállapotba potban van a folyamat. A folyamat a kezdo  (END) érkezik. A START állapotba ugrani nem lehet. Minden egyes diszkrét idopontban a folyamat továbbhalad, a megadott M mátrix szerint. Minden emittáló állapot emittál egy karaktert, mikor a folyamat az adott állapotban van. A folyamat attól válik rejtetté, hogy  mi csak az emittált karakterek láncát látjuk, magát a folyamatot nem. Néha elofordul, hogy  és végállapotot, ekkor meg kell adni egy kezdeti eloszlást, hogy a nem vezetünk be kezdo T

=

  0 idopontban melyik állapotban vagyunk (azaz melyik állapot emittál eloször). Há-

rom fontos kérdést tehetünk fel, melyeket dinamikus programozási algoritmussal fogunk megválaszolni.  kérdésünk a következo:  adott egy Markov-folyamat, és egy emittált szekvencia. Az elso Adjuk meg a Markov-folyamaton azt az utat, amelyik az adott szekvenciát emittálta, és a valószínusége  a legnagyobb. A kérdéses út megtalálását Viterbi algoritmusával oldjuk meg, ami szintén dinamikus  k karakterébol  álló programozási algoritmus. Szokás szerint Ak jelöli az A szekvencia elso szekvenciát, és ak a k-adik karaktert. A dinamikus programozás azon alapszik, hogy ha ismerjük minden k-ra és i-re a Prmax { Ak , i} valószínuséget,  azaz az Ak szekvenciát emittáló,  o  utak valószínuségei és aktuálisan az i állapotban végzod  közül a maximálisat, akkor Prmax { Ak+1 , j}

= max(Prmax {Ak , i} mi, j πaj + ) . i

k 1

(13.42)

A képlet abból adódik, hogy annak a valószínusége,  hogy egy út az adott szekvenciát emittálta, egyszeruen  a szorzata az egyes ugrások valószínuségének  és az egyes emissziók valószínuségének.  Ha adva van ilyen szorzatok halmaza, amelyekben az utolsó két szorzóté ugyanaz (jelen esetben mi, j π nyezo

j ak+1

), akkor ezek közül az a maximális, amelyikben a

 szorzata maximális. többi szorzótényezo Ha megjegyezzük, hogy az adott Prmax { Ak+1 , j} kiszámításához melyik i-t használtuk fel, akkor nyomon tudjuk követni a maximális emittáló útvonalat. Az END állapot nem

556

13. Bioinformatika

 emittál, így az algoritmus befejezodése Prmax { A}

= Prmax {A,

END}

= max(Prmax {A, i} mi,END ) ,

(13.43)

i

ahol Prmax { A} a legvalószínubb  út valószínusége.  Ha nincsen végállapot, akkor Prmax { A}

= max(Prmax {A, i}) .

(13.44)

i

Ha van START állapot, akkor a folyamat szükségképpen a START állapotból indul, úgyhogy Prmax { A0 , START }

= 1. Ha nincs start állapot, akkor Prmax { A1 , j}

=

j

p j πa1

,

(13.45)

ahol p j annak a valószínusége,  hogy a folyamat a j állapotból indul.  ha adott egy Markov-folyamat, és egy emittált szekA második kérdésünk a következo: vencia, akkor mi annak a valószínusége,  hogy az adott Markov-folyamat az adott szekvenciát emittálta? Ez a valószínuség  egyszeruen  az emittáló utak valószínuségeinek  az összege.  Mivel azonban a lehetséges emittáló utak száma exponenciálisan nohet a szekvencia hosszával, a naiv módszer, miszerint számoljuk ki minden egyes út valószínuségét,  és adjuk ezeket össze, nem járható. Dinamikus programozással azonban kiszámolható a kérdéses valószínuség.  Ezt a dinamikus programozási algoritmust hívják F algoritmusnak, és nagyon hasonlít Viterbi algoritmusára, csak maximum helyett összegzések vannak benne. A dinamikus programozás azon alapszik, hogy ha ismerjük minden k-ra és i-re a Pr { Ak , i} valószínuséget,  azaz  o  utak valószínuségeinek az Ak szekvenciát emittáló, és aktuálisan az i állapotban végzod  összegét, akkor Pr { Ak+1 , j}

=

X

j

Pr { Ak , i} mi, j πak+1

.

(13.46)

i

 Az END állapot nem emittál, így az algoritmus Pr { A}-t a következoképen számolja ki: Pr { A}

= Pr {A,

END}

=

X

Pr { A, i} mi,END

.

(13.47)

i

A

legvalószínubb 

emisszió

útját

ki

tudjuk

számolni,

és

 ebbol

megkaphatjuk

azt,

hogy a legvalószínubb  úton mely karaktert mely állapot emittálta. Azonban ennek  az útvonalnak lesznek jobban és kevésbé megbízható részei. Ezért érdeklodhetünk a



Pr ak -t az i állapot emittálta

| a folyamat az A szekvenciát emittálta



valószínuség  iránt is,

ami a harmadik olyan kérdésünk, melyet dinamikus programozással válaszolunk meg. Ez a valószínuség  nem más, mint azon utak valószínuségeinek  az összege, melyekre az i állapot bocsátotta ki az ak karaktert, osztva a teljes kibocsátási valószínuséggel.  A kérdéses utak  száma exponenciálisan nohet a szekvencia hosszával, így a naiv algoritmus, amely megkeresi ezen utakat, és egyesével összeadja a valószínuségeiket,  megint csak nem járható a gyakorlatban. k

 Eloször is ki kell számolni annak a valószínuségét,  hogy egy folyamat az A szekvenciát k

emittálta, feltéve, hogy ak -t a i állapot emittálta, ahol A az A szekvencia vége, a k

+ 1-edik

 kezdve. Ezt karaktertol n ao Forward algoritmushoz hasonló B algoritmussal lehet k

megadni. Jelöljük Pr A

,i

k

-vel annak a valószínuségét,  hogy egy folyamat az A szekvenciát

557

13.3. Algoritmusok sztochasztikus nyelvtanokon

emittálta, feltéve, hogy ak -t a i állapot emittálta. Ekkor

n

k

Pr A

,

o i

=

X

n

k+1

(Pr A

,

o

j

j mi, j πak+1 )

.

(13.48)

j



Jelöljük a Pr ak -t az i állapot emittálta get Pr {ak

| a folyamat az A szekvenciát emittálta



valószínusé

= i|A}-val. Pr {ak

= i|A} Pr {A} = Pr {A ∧ ak = i} = Pr {Ak , i} Pr n

 amibol: Pr {ak

= i|A} =

Pr { Ak , i} Pr A Pr { A}

k

,

n A

k

,

o i

,

(13.49)

o i

,

(13.50)

ami éppen a keresett valószínuség. 

13.3.2. Sztochasztikus környezetfüggetlen nyelvtanok: belülr®l, kívülr®l és a CYK algoritmus Megmutatható, hogy minden környezetfüggetlen nyelvtan átírható úgynevezett Chomskyféle normálformába. A Chomsky-féle normálformában minden levezetési szabály Wv Wy Wz vagy Ww





a alakú, ahol minden W nemterminális szimbólum, a pedig terminális

szimbólum. A sztochasztikus környezetfüggetlen nyelvtanokban a levezetési szabályokhoz valószínuségeket  rendelünk és minden nemterminális szimbólum lehetséges levezetéseihez rendelt valószínuségek  összege 1. Legyen adott egy sztochasztikus környezetfüggetlen nyelvtan és egy szekvencia (szó).  Mi a szekvencia levezetésének a valószínusége, Három kérdést tehetünk fel, az elso:  azaz a lehetséges levezetések valószínuségeinek  az összege. A második kérdés az, hogy mi a legvalószínubb  levezetés, a harmadik pedig az, hogy mi annak a valószínusége,  hogy egy részszót egy adott W x nemterminálisból kiindulva vezettük le, feltéve, hogy az adott szót  kérdésre két algoritmust vezettük le. Hasonlóan a rejtett Markov-folyamatokhoz, az elso adunk meg, a K´ ¨   , illetve a B ¨   algoritmusokat, melyek analógok az E ¨   , illetve H  ´ ´ algoritmusokkal. A második kérdésre a CYK (Cocke–Younger–Kasami) algoritmus adja meg a választ, amely a V algoritmussal analóg. A harmadik kérdésre pedig a K´ ¨   és a B ¨   algoritmusok közös alkalmazásával kaphatunk választ. A  algoritmusok hasonlóak a rejtett Markov-folyamatok algoritmusaihoz, bemutatásra kerülo  azonban lényegesen nagyobbak. a futási idok Jelöljük a Wv



Wy Wz levezetés valószínuségét  tv (y, z)-vel, a Wv

színuségét  ev (a)-val. A B ¨   algoritmus minden i





a levezetés való-

j-re és v-re kiszámolja az

α(i, j, v)

 valószínuséget,  ami annak a valószínusége,  hogy a Wv nemterminálisból levezetjük az ai -tol  részszót. A dinamikus programozás kezdeti feltételei: a j -ig terjedo

α(i, i, v) = ev (ai ) ,

(13.51)

 rekurzió: minden i-re és v-re. A fo

α(i, j, v) =

j− 1 M X M X X

y=1 z=1

k=i

α(i, k, y)tv (y, z)α(k + 1, j, z) ,

(13.52)

558

13. Bioinformatika

 ahol M a nemterminális szimbólumok száma. A dinamikus programozási táblázat egy felso  háromszög mátrix minden nemterminális szimbólumra. A táblázat kitöltése a foátlóval kez  sarok felé, a foátlóval  dodik, és innen haladunk a jobb felso párhuzamosan töltve ki a mát-

α(1, L, 1) adja meg, ahol L a szekvencia hossza, W1 pedig Θ(L3 M 3 ), a memóriaigény Θ(L2 M). minden i ≤ j-re és v-re a β(i, j, v) számokat számolja ki, ami

rixot. A levezetés valószínuségét 

 nemterminális. Az algoritmus futási ideje a kezdo A K´ ¨   algoritmus

 a j -ig terjedo  részszót Wv vezeti le osztva azon levezetések valószínusége,  melyben az ai -tol

α(i, j, v)-vel, illetve 0, ha α(i, j, v) = 0. Az algoritmus kezdeti feltételei: β(1, L, 1) = 1 , β(1, L, v) = 0

(13.53)

ha

v

,1.

(13.54)

 rekurzió: A fo

β(i, j, v)

M X i−1 M X X

=

α(k, i − 1, z)ty (z, v)β(k, j, y) +

y=1 z=1 k=1 M X M L X X

α( j + 1, k, z)ty (v, z)β(i, k, y) .

(13.55)

y=1 z=1 k= j+1

 A (13.55) képlet helyessége abból adódik, hogy végignézzük az összes lehetoséget, hogy az a nemterminális szimbólum, amely Wv -t levezette, mely részét vezette le a szekvenciának. Mint látható, a számoláshoz szükségünk van az

α-kra,

ilyen téren a K´ ¨   algoritmus

eltér a H  ´ ´ algoritmustól, amelyet futtathatunk anélkül, hogy az E ¨   algoritmust  mindenképpen le kell futtatni a B alkalmaztuk volna, míg a K´ ¨   algoritmus elott ¨ -

  algoritmust. A CYK algoritmus kezdeti értékeinek beállítása megegyezik a B ¨   kezdeti érté rekurzió is nagyon hasonlít a B keinek beállításával, a fo ¨   algoritmus rekurziójához, csak összeadás helyett maximalizálni kell:

αmax (i, j, v) = max max y

z

max

i≤k≤ j−1

αmax (i, k, y)tv (y, z)αmax (k + 1, j, z) .

A legvalószínubb  levezetés valószínuségét  pedig

(13.56)

αmax (1, L, 1) adja meg. A legvalószínubb 

levezetést az optimális értékeket adó levezetési szabályokon keresztül kaphatjuk meg.  a j -ig terjedo  részszót, Végezetül annak a valószínuségét,  hogy Wv vezette le az ai -tol feltéve, hogy az A szekvenciát vezettük le,

α(i, j, v)β(i, j, v) α(1, L, 1)

(13.57)

adja meg.

Gyakorlatok 13.3-1. A reguláris nyelvtanokban a levezetési szabályok Wv

→ aWy vagy Wv → a alakúak.

Mutassuk meg, hogy minden rejtett Markov-folyamat sztochasztikus reguláris nyelvtan, de nem minden sztochasztikus reguláris nyelvtan rejtett Markov-folyamat. 13.3-2. Adjunk meg dinamikus programozási algoritmust, mely adott sztochasztikus reguláris nyelvtanra és A szekvenciára megadja a

559

13.3. Algoritmusok sztochasztikus nyelvtanokon



levezetés valószínuségét, 



a legvalószínubb  levezetést,



valamint annak a valószínuségét,  hogy a szekvencia egy adott ai karakterét egy adott levezetési szabály vezette le.

13.3-3. Egy rejtett Markov-modellben lehetnek úgynevezett csendes vagy nem kibocsátó  állapotok, melyek a rejtett Markov-modell ábrázolását elosegíthetik. Mutassuk meg, hogy minden rejtett Markov-modell, mely csendes állapotokat tartalmaz, átírható olyan rejtett Markov-modellé, amely nem tartalmaz csendes állapotokat, és ekvivalens az eredeti modellel, azaz ugyanazon szekvenciákat ugyanakkora valószínuséggel  bocsátja ki. 13.3-4.

A páros rejtett Markov-modellek olyan rejtett Markov-modellek, melyekben az

 egyes állapotok nem csak egy szekvenciába bocsátanak ki karaktereket, hanem kettobe. Egyes állapotok csak az egyik szekvenciába, mások csak a másikba, ismét mások pedig mindkét szekvenciába bocsátanak ki karaktereket. Egy állapot egy lépésben mindegyik szekvenciába legfeljebb egy karaktert bocsáthat ki. Adjuk meg a páros rejtett Markovfolyamatok V, E és H algoritmusait.  ´ 13.3-5. Viterbi algoritmusában nem használtuk ki, hogy a tranzíciók és a kibocsátási való színuségek  valószínuségek,  azaz nem negatívak és eggyé összegzodnek. Valamint az algoritmus akkor is muködik,  ha szorzás helyett összeadások vannak, és maximalizálás helyett akár minimalizálhatunk is. Adjunk meg egy olyan módosított páros rejtett Markov-modellt (amelyben a

valószínuségek”  nem feltétlenül nem negatívak, és nem feltétlenül összeg”  zodnek eggyé), melyre Viterbi algoritmusa összeadásokkal és minimalizálással ekvivalens Gotoh algoritmusával. 13.3-6. Másodlagos térszerkezetnek nevezzük az RNS-ek olyan bázispárosodását, amely a szekvencia fölött haladó ívek nem metben a bázispárosodott nukleinsavakat összeköto, szik egymást. A lehetséges bázispárosodások: A − U , U

− A, C − G, G − C, G − U

és U

− G.

Adjunk meg egy dinamikus programozási algoritmust, amely egy adott RNS szekvenciára megkeresi azt a másodlagos térszerkezetet, melyben a párosodott nukleinsavak száma maximális. 13.3-7. A Knudsen–Hein-nyelvtan levezetési szabályai:

S



LS | L

F

→ →

dFd | LS

L

,

s|dFd

,

,

ahol minden s terminális levezetést még helyettesíteni kell az RNS szekvenciák lehetséges karaktereivel, a dFd kifejezésben pedig a két d terminális szimbólumot helyettesíteni kell a lehetséges bázispárosodásokkal. Mutassuk meg, hogy adott szekvencia és a levezetések adott valószínuségi  eloszlása esetén meg lehet adni egy olyan dinamikus programozási algoritmust, amely megadja a szekvencia levezetésének a valószínuségét,  anélkül, hogy Chomsky-féle normálformába írnánk át a nyelvtant.

560

13. Bioinformatika

13.4. Szerkezetek összehasonlítása  szerkezeteket hasonlítunk össze dinamikus programozási alAz alábbi részben különbözo goritmusok segítségével. Mint meg fogjuk mutatni, a címkézett, gyökeres fák illesztésére használt algoritmus általánosítása a szekvenciák összehasonlítására használt algoritmusnak.  algoritmus egy lineáris egyenletA rejtett Markov-modellek összehasonlítását végzo rendszer megoldásával adja meg két rejtett Markov-modell együttes kibocsátásának a valószínuségét,  azaz annak a valószínuséget,  hogy két rejtett Markov-modell ugyanazt a szekvenciát bocsátja ki.

13.4.1. Címkézett, gyökeres fák illesztése Σ egy véges ABC, Σ− = Σ ∪ {−}, Σ2 = Σ− × Σ− \{−, −}. Egy F fa címkézésén egy olyan függvényt értünk, mely az F fa minden egyes n ∈ VF csúcsához hozzárendeli Σ egy

Legyen

karakterét. Ha egy gyökeres fából kitörlünk egy csúcsot, akkor a kitörölt csúcs gyerekei a  kitörölt csúcs szülojének a gyerekei lesznek. Amennyiben a fa gyökerét töröljük ki, a fa er dore esik szét. Legyen A egy gyökeres fa, melynek csúcsai az ezt meghatározó függvény legyen c : VA és G

→ Σ

2

Σ2

elemeivel vannak címkézve,

. Azt mondjuk, hogy A illesztése az F

Σ karaktereivel címkézett, gyökeres fáknak, ha

 és második koA címkézéseinek elso

ordinátáján vett megszorításával, és az így '−' szimbólummal címkézett csúcsok törlésével rendre az F és G fákat kapjuk vissza. Legyen adva egy hasonlósági függvény, s :

Σ2 →

R. Erre a hasonlósági függvényre

semmilyen megkötést nem teszünk, egy karakter lehet akár kevésbé hasonló önmagához, mint egy másik karakterhez. F és G fák optimális illesztésén egy olyan kézett A fát értünk, melyre

Σ2

elemeivel cím-

X s(c(n))

(13.58)

n∈VA

maximális. Ezt a fát AF,G -vel fogjuk jelölni. Vegyük észre, hogy egy szekvencia ábrázolható olyan faként, melynek egyetlen levele van. A továbbiakban csak olyan fákkal foglalkozunk, melyekben bármely csúcsnak legfeljebb két gyereke van. Az optimális illesztést megadó dinamikus programozás a gyökeres részfákon történik, ezek azon részfák, melyek a fa egy adott csúcsát, mint gyökeret és ezek leszármazottjait tartalmazzák. Az r gyökér által meghatározott részfát tr -rel jelöljük. Egy fát egy üres fához csak egyféleképen illeszthetünk. Két, a, ill. b karakterekkel címkézett levél illesztése csak három módon lehetséges: az illesztés vagy egyetlen csúcsot tartalmaz, és (a, b)-vel van címkézve, vagy két csúcsot tartalmaz, ezek közül az egyik (a, −), a másik (−, b) címkézésu,  és a két csúcs közül az egyik a gyökér, a másik ennek a gyereke. Ez utóbbi  két lehetoség ekvivalens a hasonlósági függvény szempontjából. Hasonlóan, egy levelet egy gyökeres részfával úgy lehet összeilleszteni, hogy az A illesztésben vagy együtt van címkézve a levél karaktere a részfa valamely karakterével, vagy egy '−' szimbólummal van együtt címkézve. Ez utóbbi címkézést tartalmazó csúcsot a részfába sokféleképen lehet beszúrni, de ezek mindegyike ekvivalens. Ezután az inicializáció után a dinamikus programozásban egyre nagyobb részfákat illesztünk össze. Feltehetjük, hogy tr , illetve t s részfák esetében ismerjük már az Atr ,t x , Atr ,ty , Atu ,t s , Atv ,t s , Atu ,t x , Atu ,ty , Atv ,t x és Atv ,ty illesztéseket, és ezen illesztések értékeit, ahol u és v csúcsok r gyerekei, x és y csúcsok pedig s gyerekei (amennyiben valamelyik csúcsnak csak

561

13.4. Szerkezetek összehasonlítása

egy gyereke van, akkor természetesen kevesebb részproblémára vezetjük vissza a problémát). Valamint ismerjük a tu , tv , t x és ty fáknak az üres részfához való illesztésének az értékét is. Legyen r címkézése a, s címkézése b. Ezek után Atr ,t s meghatározásához konstans  sok lehetoséget kell végignézni: vagy az egyik részfa a másik részfában valamely gyerek hez van illesztve, és ekkor a másik gyerek és a gyökér a '−' szimbólummal címkézodik az   illesztésben, vagy r és s összeillesztodik, vagy bár nem illesztodnek össze, de Atr ,t s -ben az  csúcs a gyökér, a másik pedig ennek a gyereke. Ez utóbbi két egyik gyökérnek megfelelo esetben a gyerekeket vagy összeillesztjük, vagy nem. Zz öt lehetséges eset.  a fa csúcsainak számával, az optiMivel a lehetséges gyökeres részfák száma egyenlo  mális illesztés megkeresheto

 Θ(|F ||G|) idoben, ahol | F | és |G | F

és G csúcsainak száma.

13.4.2. Két rejtett Markov-modell együttes kibocsátási valószín¶sége Legyen adva két Markov-modell, M1 és M2 . A két modell együttes kibocsátási valószínu sége deníció szerint: C(M1 , M2 )

=

X

Pr M1 { s} Pr M2 { s} ,

(13.59)

s

ahol az összegzés az összes lehetséges szekvencián megy, Pr M { s} pedig annak a valószínu sége, hogy az M modell az s szekvenciát bocsátotta ki. Azt, hogy a p út az s szekvenciát bocsátotta ki, e( p)

=

s-sel jelöljük, egy START állapottól x állapotig tartó utat pedig [x]-szel.

Mivel a kibocsátási valószínuség  a lehetséges kibocsátó utak valószínuségeinek  az összege,

C(M1 , M2 )

=

 X    s

=

X Pr M1 p1 ∈ M1 ,e( p1 )= s

   { p1 } 

X

Pr M1

X Pr M2 p2 ∈ M2 ,e( p2 )= s

  { p2 }

{ p1 } Pr M { p2 } .

(13.60)

2

p1 ∈ M1 , p2 ∈ M2 ,e( p1 )=e( p2 )

Ez utóbbi képletben gyelembe kell venni, hogy egy útvonalra több lehetséges kibocsátás van, az összegzések a lehetséges útvonalak és kibocsátások együttesein mennek, az útvonal valószínuségébe  pedig beleértjük a kibocsátási valószínuségeket  is. Jelöljük p ¯ 1 -gyel azt  kapunk a végállapot elhagyásával, valamint p1 -nek az END1 az útvonalat, amelyet p1 -bol  állapot elotti állapota legyen x1 . ( p ¯ 2 -t és x2 -t hasonlóan deniáljuk.) Ekkor C(M1 , M2 )

X

=

m x1 ,END1 m x2 ,END2 Pr M1

{ p¯ 1 } Pr M { p¯ 2 } 2

p1 ∈ M1 , p2 ∈ M2 ,e( p1 )=e( p2 )

=

X

m x1 ,END1 m x2 ,END2 C(x1 , x2 )

,

(13.61)

x1 , x2

 az END állapotba ugrás valószínusége, ahol m x,END az x-bol  valamint C(x1 , x2 )

X

=

Pr M1 {[x1 ]} Pr M2 {[x2 ]}

.

(13.62)

,

(13.63)

[x1 ]∈ M1 ,[x2 ]∈ M2 ,e([x1 ])=e([x2 ])

 képlettel is: C(x1 , x2 )-t meg lehet adni a következo C(x1 , x2 )

=

X y1 ,y2

my1 , x1 my2 , x2 C(y1 , y2 )

X σ∈Σ

Pr {σ| x1 } Pr {σ| x2 }

562

13. Bioinformatika

ahol Pr {σ| xi } annak a valószínusége,  hogy az xi állapot

σ-t bocsátotta ki. A (13.63) képlet

egy lineáris egyenletrendszert deniál az összes x1 és x2 kibocsátó állapotokra. A kezdeti feltételek: C(START 1 , START 2 )

= = =

C(START 1 , x2 ) C(x1 , START 2 )

,

1

(13.64)

0,

x2

0,

x1

, START 2 , , START 1 .

(13.65) (13.66)

 Azonban a dinamikus programozás a szokásostól eltéroen nem egy táblázat kitöltésével, hanem a (13.63) képlet által meghatározott egyenletrendszer  megoldásával történik. Így az együttes kibocsátási valószínuség  meghatározható O (n1 n2 )

3

 idoben, ahol ni az Mi modell-

ben a kibocsátó állapotok száma.

Gyakorlatok 13.4-1. Adjuk meg két fa lokális hasonlóságát, ami a két fa leginkább hasonló részfái il  részét érjük. lesztésének az értéke. Részfán most a fa tetszoleges összefüggo 13.4-2. Rendezett fákon olyan gyökeres fákat értünk, melyben minden csúcs gyerekei ren dezve vannak. Rendezett fák rendezett illesztése megorzi a két fa gyerekeinek a rendezését. Adjunk olyan algoritmust, amely két rendezett fának egy optimális rendezett illesztését adja meg, és a számolási igénye mind a fák csúcsszámának, mind a gyerekszám maximális értékének polinomiális függvénye. 13.4-3. Vegyük azt a végtelen dimenziós euklideszi teret, melynek a koordinátái a lehetséges szekvenciák. Minden rejtett Markov-modell egy vektorral adható meg ebben a térben, a vektor j-edik koordinátája megadja a j-edik szekvencia levezetésének a valószínuségét.  Határozzuk meg két rejtett Markov-modell által bezárt szöget ebben a térben. 13.4-4. Adjuk meg egy rejtett Markov-modell által kibocsátott szekvenciák hosszainak generátorfüggvényét, azaz a

∞ X

pi ξ

i

i= 0

függvényt, ahol pi annak a valószínusége,  hogy a rejtett Markov-modell i hosszúságú szekvenciát bocsájt ki. 13.4-5. Adjuk meg egy páros rejtett Markov-modell által kibocsátott szekvenciák hosszainak generátorfüggvényét, azaz a

∞ X ∞ X i=0

pi, j ξ

i

ηj

j=0

függvényt, ahol pi, j annak a valószínusége,  hogy a rejtett Markov-modell által kibocsátott  szekvencia i, a második pedig j hosszúságú. elso

13.5. Törzsfakészítés távolságon alapuló algoritmusokkal  irányítatlan, súlyozott élu, Ebben a fejezetben törzsfákon olyan összefüggo,  körmentes gráfokat értünk, melyben semelyik csúcsnak nincs kettes fokszáma. A súlyok nem negatívak,  csúcsot köt össze, a súlyok pozitívak. Olyan törzsés minden olyan élre, mely két belso  módszerekkel ismerkedünk meg, amelyek bemeno  adatai objektumok halmaza, fakészíto

13.5. Törzsfakészítés távolságon alapuló algoritmusokkal

563

valamint mindegyik objektumpárra megadott távolság. Ez a távolság származhat például  vett távolságokból, de az itt bemutatásra kerülo  algoszekvenciák optimális illesztésébol  ritmusok tetszoleges távolságokra muködnek.  A fák levelei a megadott objektumok, a fa topológiáját és a fa éleinek a hosszát pedig a távolságadatokból származtatjuk. Minden fa ábrázol egy, a leveleken, mint objektumokon deniált metrikát: két objektum közötti tá út hosszával deniáljuk. Az algoritmusok jóságát volságot az ezen objektumokat összeköto lehet mérni a bemeneti távolságok és a megkonstruált fa által meghatározott távolságok közötti különbséggel. Két speciális metrikát fogunk deniálni, az ultrametrikát és az additív metrikát. Az osztályozó algoritmusok mindig olyan törzsfát készítenek, amelyek ultrametrikát reprezen távolságok tálnak. Be fogjuk bizonyítani, hogy amennyiben a bemeneti adatokban szereplo ultrametrikus tulajdonságúak, akkor az osztályozó algoritmusok által meghatározott fa pontosan ezt fogja reprezentálni. Hasonlóan a szomszédok egyesítése módszer additív metrikát reprezentáló fát készít,  távolságokokra teljesül az additív metrika, akkor a szomszédok egyesítése és ha a bemeno visszaadja ezt a metrikát. Mindkét bizonyítás esetében szükségünk lesz az alábbi lemmára: 13.3. lemma. Bármely metrikára legfeljebb egy olyan fa van, amely ezt ábrázolja. Bizonyítás. Két objektumra az állítás triviális. A bizonyítás indirekten, teljes indukcióval történik. Az indukciót három objektummal kezdjük. Három objektum esetében egyetlen fa  csúcsával összeköto  topológia létezik, a csillag alakú. Legyen az i, j és k leveleket a fa belso élek hossza rendre x, y és z. Az élek hosszait az

+y = x+z = y+z =

x

di, j di,k

, ,

dk,l

(13.67) (13.68) (13.69)

egyenletrendszer adja meg, aminek egyetlen megoldása van, mivel az

1 1 0

1 0 1

1 0

(13.70)

1

determináns nem 0. n

> 3 objektum esetében tegyük fel, hogy van két fa, amely ugyanazt a metrikát repre-

 fán keressünk két olyan levelet, i-t és j-t, melyeket összeköto  úton zentálja. Ekkor az elso egyetlen egy csúcs van, legyen az a csúcs u. Ilyen i és j csúcsokat minden fában találunk,  csúcsok száma a legnagyobb, az út mindkét vegyünk egy olyan utat a fában, melyben a belso  úton egyetlen csúcs végén ilyen levélpár található. Ha a második fában i-t és j-t összeköto  csúccsal összeköto  élek hossza azonos, és úgyszintén a j-t van, akkor a két fában i-t a belso  csúccsal összeköto  élek hossza azonos, mivel tetszoleges  a belso k(, i, j) objektumra mindkét fa esetében ugyanazt a részfát kell kapnunk (melyben az u és k közötti utat egyetlen du,k hosszúságú éllel ábrázoljuk). Legyártunk egy új metrikát, melyben elhagyjuk az i és j ob-

0

jektumokat, bevezetünk egy u objektumot, melynek bármely k objektumtól vett távolsága  él hossza. A két fában elhagyjuk az i és j csúcsokat, di,k − di,u , ahol di,u , az i-t u-val összeköto

564

13. Bioinformatika

13.2. ábra. Egy dendrogram.

 ha u fokszáma 3 volt i és j elhagyása elott, akkor u levél lesz az új fában, és most ez fogja

0

0

reprezentálni u -t, ha u nem levél i és j elhagyása után, akkor u-ba behúzunk egy u levelet, az új él hossza pedig 0. Így olyan fákat kapunk, melyek ezt a metrikát reprezentálják, és az indukció szerint azonosak.  úton nem egy csúcs van, akkor ellentHa viszont a második fában i-t j-vel összeköto  úton egy olyan u1 csúcs, mondásra jutunk. Ugyanis ebben a fában van az i-t j-vel összeköto melyre di,u

, di,u

1

. Vegyünk a második fában egy olyan k csúcsot, melyre az i-t k-val össze-

 út áthalad u1 -en. Az elso  fából számolva köto

− d j,k = di,u − d j,u = 2di,u − di, j ,

(13.71)

− d j,k = di,u − d j,u = 2di,u − di, j ,

(13.72)

di,k míg a második fán di,k

ami ellentmond annak, hogy di,u

1

, di,u

1

1

1

.

13.5.1. Osztályozó algoritmusok 13.4. deníció. Egy metrikát ultrametrikának nevezünk, ha bármely i, j és k csúcsokra di, j

≤ max{di,k ,

d j,k }

(13.73)

Könnyen belátható (lásd 13.5-1. gyakorlat), hogy egy ultrametrikában bármely három csúcs  három távolság vagy mind azonos, vagy közülük ketto  azonos, a harmadik pedig között levo ennél kisebb. 13.5. tétel. Ha objektumok egy véges halmazán deniált metrika ultrametrika, akkor pontosan egy olyan fa létezik, amely ezt ábrázolja. Továbbá ezt a fát le lehet gyökereztetni úgy, hogy minden levélnek a gyökértol  vett távolsága azonos legyen. Bizonyítás. A 13.3. lemma alapján legfeljebb egy ilyen fa van, így elég megkonstruálni egy ilyen fát bármely ultrametrikára. Az ultrametrikus fákat dendrogramokként fogjuk ábrázolni, ezekben a reprezentációkban a vízszintesen húzott élek hosszát 0-nak tekintjük (lásd 13.2. ábra). A tétel bizonyítása a levelek, mint objektumok száma szerinti indukcióval törté objektum esetében nyílván meg tudjuk konstruálni a dendrogramot. Ha n levélre nik. Ketto

565

13.5. Törzsfakészítés távolságon alapuló algoritmusokkal

-

6 di,n+1 /2

i

13.3. ábra. Az (n

j

i

i

0

n

? +1

+ 1)-edik levél bekötése a dendrogramba.

megkonstruáltuk már a dendrogramot, az (n

+ 1)-edik

 levéllel a következoképpen járunk

 elindulunk a gyökér felé, el: Keresünk egy olyan i-t, melyre di,n+1 minimális. Ezután i-bol és di,n+1 /2 magasságban kötjük be az (n

+ 1)-edik levelet (lásd 13.3. ábra). Ez a dendrog vett távolságát. Ugyanis + 1)-edik levéltol + 1-ik levél bekötésének helye alatt helyezkedik

ram helyesen ábrázolja az összes csúcsnak az (n az összes olyan i el, di,i 0



0

csúcsra, amely az n

di,n+1 , és az ultrametrikus tulajdonságból, valamint di,n+1 minimalitásából követ-

kezik, hogy ekkor di,n+1

=

di 0 ,n+1 . Másrészt az összes többi j csúcsra di, j

ultrametrikus tulajdonságból adódóan ekkor d j,n+1

>

di,n+1 , és az

= di, j .

2

Könnyen belátható, hogy a bizonyításban használt megkonstruálás számolási igénye O(n ), ahol n az objektumok száma. Megadhatunk egy másik algoritmust is, amely megkeresi azt az i és j objektumpárt, amire di, j minimális. Az ultrametrikus tulajdonságból adódóan minden k-ra di,k

= d j,k (≥ di, j ), így az i és

j objektumpárt lecserélhetjük egyetlen új objektumra,

 vett távolsága jól deniált. Az i és a j objektués ezen új objektumnak az összes többitol mot összekötjük di, j /2 magasságban, és az így kapott részdendrogramot egy objektumnak  tekintve folytatjuk az iterációt. Ez az algoritmus lassabb, mint az elobbi bizonyításban megadott algoritmus, viszont ez az alapja az úgynevezett osztályozó algoritmusoknak. Az osz távolságok nem tályozó algoritmusok mindig dendrogramot adnak, akkor is, ha a bemeno  adatok ultrametrikus tulajdonságúak, akkor az alkotnak ultrametrikát. Viszont ha a bemeno osztályozó algoritmusok többsége pontosan visszaadja az ezt reprezentáló dendrogramot. Mindegyik osztályozó algoritmus azt az i és j objektumokat (illetve az iteráció további lépéseiben objektumok helyett objektumhalmazok is szerepelhetnek) keresi meg, amelyre di, j minimális. A módszerek közötti különbség abban rejlik, hogy ezután hogyan határozzák meg az új objektumhalmaz és a többi objektum(halmaz) közötti távolságot. Ha az új  módszerek következoképpen  objektumot u-val jelöljük, akkor az alább ismertetésre kerülo deniálják du,k -t:



E : du,k  - ´



T- : du,k ´



C : (UPGMA) u és k elemei páronkénti távolságainak számtani közepe, azaz ´ du,k

= min{di,k , d j,k }.

= max{di,k , d j,k }.

= (di,k ×|i|+ d j,k ×| j|)/(|i|+| j|), ahol |i| és | j| az i és

j objektumhalmazok elemszámai.



E : Az átlagok átlagát vesszük, azaz du,k  - ´

= (di,k + d j,k )/2.



C: Ezt a módszert leggyakrabban akkor alkalmazzák, amikor az objektumok

566

13. Bioinformatika k

| j|

i

u

|i|

j

13.4. ábra. du,k számolása a C módszer szerint.

beágyazhatóak Euklideszi térbe. Ekkor a két objektumhalmaz közötti távolságot az objektumhalmazok centrumai közötti távolságként lehet deniálni. A számoláshoz azonban nem feltétlenül kell az Euklideszi tér koordinátáit használni, hiszen a kérdéses du,k távolság nem más, mint az i, j és k csúcsok által meghatározott háromszögben a k csúcsból kiinduló, az i j szakaszt | j| : |i| arányban osztó szakasz hossza (lásd 13.4. ábra), ez pedig a di, j , di,k és d j,k adatokból már meghatározható. Ez a számolási mód akkor is alkalmazható, ha az objektumok nem ágyazhatók be Euklideszi térbe, így bár a módszer ötlete geometriai indíttatású, bármely távolságmátrixra alkalmazható.



M ´ : Az u objektumhalmaz centrumát i és j centrumainak centrumaként deniáljuk. Így ez a módszer úgy viszonyul a centroid módszerhez, mint az egyszeru  átlag a csoportátlaghoz. Erre a módszerre is igaz, hogy nem kell du,k számolásához az Euklideszi koordinátákat ismerni, hiszen a keresett távolság az i jk háromszögben a k-ból induló súlyvonal hossza.

 négy módszer visszaadja a távolságokat reprezentáló Könnyen belátható, hogy az elso  adatok ultrametrikus tulajdonságúak, hiszen ekkor dendrogramot, amennyiben a bemeno di,k

=

d j,k . A C és a M ´ módszerek azonban nem adják vissza az ultrametrikát

 d j,k -val). reprezentáló dendrogramot, hiszen du,k kisebb lesz, mint di,k (ami egyenlo Az osztályozó algoritmusok általános problémája, hogy mindig dendrogramot adnak vissza, és ez biológiailag nem feltétlenül helyes. Ugyanis biológiai szekvenciák leszármazási kapcsolatait csak az úgynevezett molekuláris óra muködésének  esetében ábrázolja helyesen egy dendrogram. A molekuláris óra elmélet szerint az egyes szekvenciák a törzs  fejlodés során adott idotartam alatt ugyanakkora mennyiségu  mutáción mentek át, azonban számos biológiai példa mutatja azt, hogy ez nem mindig teljesül. Ezért szeretnénk egy olyan  adatsorokra, ha a bemeno  táalgoritmust, amely csak akkor ad ultrametrikus fát a bemeno volságok valóban ultrametrikus tulajdonságúak. Ezért mára a S ´ 

´´ 

al-

goritmus sokkal népszerubbé  vált a bioinformatikai alkalmazásokban, mint az osztályozó algoritmusok.

13.5.2. Szomszédok egyesítése 13.6. deníció. Egy metrikát additív vagy négycsúcs metrikának nevezünk, ha bármely i, j, k és l csúcsára di, j

+ dk,l ≤ max{di,k + d j,l ,

di,l

+ d j,k } .

(13.74)

567

13.5. Törzsfakészítés távolságon alapuló algoritmusokkal k l

u n

+1

i

13.5. ábra. Az (n

+ 1)-edik levél gyökereztetése additív fa megkonstruálásához.

13.7. tétel. Ha objektumok egy véges halmazán deniált metrika additív, akkor pontosan egy olyan fa létezik, amely ezt reprezentálja. Bizonyítás. A 13.3. lemma alapján legfeljebb egy ilyen fa van, így elég megkonstruálni egy  ilyen fát bármely additív metrikára. Eloször a konstrukciót adjuk meg, ezután bizonyítjuk a konstrukció helyességét: Három objektumra a (13.67–13.69) egyenletek alapján megkonstruálunk egy fát, ezután a konstrukció indukcióval történik, feltesszük, hogy n



3 objektumra már elkészítettük a

fát, az (n + 1)-edik objektumot reprezentáló levelet pedig egy éllel valahova bekötjük a már  fába. Ehhez eloször  meglévo meghatározzuk az új fa topológiáját, majd az új él hosszát. A   indulunk el. Jelöljük i szomszédját topológia meghatározásához egy tetszoleges i levéltol  kiinduló utakon keressünk egy-egy u-val, u-ból még legalább két él indul ki, ezen élekbol levelet, jelöljük ezeket k-val és l-lel (lásd 13.5. ábra). Az (n

+ 1)-edik

 levél bekötése i-bol

nézve az u csúcson innen van, ha di,n+1

+ dk,l < di,k + dn+1,l .

(13.75)

Hasonlóképpen megállapíthatjuk, hogy az (n + 1)-edik levél bekötése k, illetve az l csúcsból  kiinnézve u-n innen van-e. Ha u fokszáma nagyobb, mint három, akkor a további élekbol

0

0

duló utakon is keresünk l csúcsokat, és az i, n + 1, k és l csúcsnégyesekre hasonlóan járunk el. Az additív metrika tulajdonságából következik, hogy legfeljebb egy esetben állhat fenn   az adott irányú egyenlotlenség. Ha egyetlen esetben áll fenn ilyen irányú egyenlotlenség, és ez az i levél esete, akkor az (n

+ 1)-edik levelet az i-t u-val összeköto élhez kötjük be. Ha

 egyenlotlenség más esetben áll fenn, akkor vesszük azt a maximális részfát, amelynek egy levele u, és tartalmazza az (n + 1)-edik levél bekötését. Deniáljuk du,n+1 -et mint di,n+1 − di,u , és ezután u-t i-nek átnevezve folytatjuk a bekötés helyének keresését. Ha minden esetben  egyenloséget kapunk, akkor az (n

+ 1)-edik levelet az u csúcshoz kötjük be.

 él Miután megtörtént a bekötés helyének megkeresése, meghatározzuk a beköto hosszát. Ha az (n

+ 1)-ik

 élen kötjük be, akkor jelöljük a beköto  élt az i-t u-val összeköto

csúcsot u1 -gyel (13.6/b ábra). Deniáljuk du,n+1 -et (dl,n+1

− dl,u )-ként. Ekkor a du,u , di,u , + 1 objektumok távolságait reprezentáló fa adja meg, melyet a (13.67–13.69) egyenletek alapján számolunk ki. Ha az (n + 1)-edik levelet az

valamint a du1 ,n+1 távolságokat az i, u és n

1

1

568

13. Bioinformatika l

k

k n

+1

u

k1

l

k1

u u1

i

n

+1

i b)

a) k

l

n

u

+1

i c)

13.6. ábra. Néhány fa topológia a 13.7. tétel bizonyításához.

u csúcshoz kötjük be, akkor du,n+1

= di,n+1 − di,u .

 Ezután rátérünk a konstrukció helyességének a bizonyítására. Eloször azt látjuk be, hogy amikor az (n

+ 1)-ik levél bekötésének a helyét keressük, és egy új részfán deniáljuk

a du,n+1 távolságot, akkor a megadott deníció jól deniált, azaz bármely olyan j csúcsra,

− d j,u = di,n+1 − di,u . Ha az új részfa = k csúcsra nyilván teljesül, mely k csúcs alapján határoztuk  és meg az (n + 1)-edik levél helyzetét (lásd 13.6/a ábra). Az (n + 1)-edik levél helyzetébol

mely nem szerepel az újonnan deniált részfában, d j,n+1 tartalmazza l-t, akkor ez azon j

az additív metrika tulajdonságából adódóan

+ di,l = di,n+1 + dk,l ,

dk,n+1  ha felhasználjuk a di,l amibol

(13.76)

 = di,u + du,l és a dk,l = dk,u + du,l egyenloségeket, adódik, hogy dk,n+1

− dk,u = di,n+1 − di,u .

(13.77)

Ugyanígy minden olyan k1 levélre, melyet nem választ el k-tól az u csúcs, fennáll a dk1 ,n+1

+ di,l = di,n+1 + dk

,l

(13.78)

+ dl,n+1 < dk,n+1 + dk ,l

(13.79)

1

 egyenloség. Ez az additív metrikából és a dk,k1

1

  adódik, ez utóbbi pedig levezetheto  a egyenlotlenségb ol dk,k1

+ di,l < dk ,l + dk,i 1

(13.80)

569

13.5. Törzsfakészítés távolságon alapuló algoritmusokkal

és dl,n+1

+ dk,i < di,l + dk,n+1

(13.81)

  Hasonlóan, ha u fokszáma háromnál nagyobb, akkor minden olyan egyenlotlenségekb ol. csúcsra, melyet u elválaszt az (n

 hasonló egyenloségek   + 1)-edik levéltol, és egyenlotlensé-

gek állnak fenn. Az új élhosszak kiszámolásából adódik, hogy a di,n+1 távolságot helyesen reprezentálja az új fa, és így a d j,n+1 távolságot az összes olyan j csúcsra, melyet i elválaszt (n

 + 1)-tol.

 adódóan az ábrán i lehet egy (Ne feledjük el, hogy a beágazás helyének megkeresésébol korábbi u.) Ha az (n

+ 1)-edik levél bekötése az u-t az i-vel összeköto szakaszon van (13.6/b ábra),

akkor du,n+1 deníciójából adódóan dl,n+1 -et is helyesen ábrázolja a fa. A dk,n+1

+ di,l = dk,i + dl,n+1

(13.82)

  egyszeruen  hogy egyenloségb ol  levezetheto, dk,n+1

= dk,u + du,n+1 ,

(13.83)

 így a dk,n+1 távolságot is jól reprezentálja a fa. Az elobbi levezetésekkel analóg módon belátható, hogy minden olyan k1 -re, melyet u nem választ el k-tól, a dk1 ,n+1 távolságot helyesen reprezentálja a fa, és valójában az összes olyan j csúcsra, melyet u elválaszt n

 + 1-tol,

a

d j,n+1 távolságot helyesen reprezentálja az elkészített fa. Ha az (n

+ 1)-edik levelet az u csúcshoz kötjük be (13.6/c ábra), akkor a di,n+1

+ dk,l = dk,i + dl,n+1 = dk,n+1 + d j,i

(13.84)

  már levezetheto,  hogy mind dk,n+1 -et, mind dl,n+1 -et helyesen reprezentálja egyenloségekb ol a fa, és a fentiekhez hasonló okoskodásból következik, hogy ez valójában igaz minden olyan csúcsra, melyet u elválaszt (n

 + 1)-tol.

Ezzel n csúcs távolságait helyesen reprezentáló fából kiindulva megkonstruáltunk egy olyan fát, mely n

+

1 csúcs távolságát reprezentálja helyesen (feltéve, hogy a csúcsokra

teljesül az additív metrika), így bizonyítottuk a 13.7. tételt.

Könnyen belátható, hogy a fenti algoritmus, mely megkonstruálja azt a fát, amely egy 2

 igényel. Az algoritmus azonban csak akkor muködik additív metrikát reprezentál, O(n ) idot   távolságok additív metrikát alkotnak. Ellenkezo  esetben több esetben helyesen, ha a bemeno  így nem tudnánk eldönteni, hogy hol kössük be az is fennállhat a (13.75) egyenlotlenség, (n

+ 1)-edik levelet. Az alábbiakban megadunk egy Θ(n3 ) ideju algoritmust, amely szintén

 távolságok additív metrikát az additív metrikát reprezentáló fát adja vissza, ha a bemeno alkotnak, de egy additív fát ad vissza egyéb esetekben is.  A S muködik:  Adott csúcsok egy ´ -´ ´  algoritmus a következoképpen  halmaza n elemmel, és egy ezen értelmezett metrika, d. Eloször kiszámítjuk az összes i csúcsra a többi csúcstól vett távolságok összegét:

vi

=

n X

di, j j= 1

.

(13.85)

570

13. Bioinformatika i

l u

w

k

j

 csúcs választja el. 13.7. ábra. Az i, j, k és l csúcsok elhelyezkedése, amennyiben i-t és j-t egyetlen u belso

Ezután megkeressük azt a csúcspárt, melyre si, j

= (n − 2)di, j − vi − v j

(13.86)

 csúcsig húzott élek hossza minimális. Az i és a j csúcsokból az új, u belso

ei,u

di, j

=

2

illetve e j,u

=



vi

− vj , −4

(13.87)

2n

di, j

− ei,u

2

(13.88)

Ezután következik a távolságmátrix átszámolása. Az i és j csúcsok kiesnek, helyükre kerül be az u csúcs. Az u csúcs és a többi csúcs közötti távolságot az alábbi képlettel határozzuk meg: dk,u

=

dk,i

+ dk, j − di, j 2

.

(13.89)

13.8. tétel. Ha a bemeno  csúcsokon megadott d metrika additív metrika, akkor a S-

´ -´´  algoritmus visszaadja azt a fát, mely ezt a metrikát reprezentálja.  adódóan pontosan egy fa létezik, amely ezt a metrikát ábráBizonyítás. A 13.7. tételbol zolja. Ha az algoritmusban az újonnan kiválasztott i és j csúcsokat ezen a fán csak egyetlen  csúcs választja el, akkor egyszeru belso  számolásból adódik, hogy a S ´ -´ ´  algoritmus helyesen jár el. Így elég azt bizonyítani, hogy a kiválasztott i és j csúcsok mindig a megadott módon helyezkednek el.   csúcs választja el, akkor Eloször azt látjuk be, hogy ha i-t és j-t csak egyetlen egy belso bármely k-ra si, j deníciót, az si, j

< si,k és si, j < sk, j . Valóban, alkalmazva a (13.86)  < si,k egyenlotlenséget átrendezve kapjuk, hogy

X (di, j

− di,l − d j,l ) − 2di, j −

(d j,k

− d j,m − dk,m ) + 2d j,k < 0

(13.90)

m, j,k

l,i, j

Amennyiben l

X

 egyenletben szereplo

= m , i, j, k, a szummákból kapjuk, hogy (di, j

− di,l − d j,l ) − d j,k + d j,l + dk,l = 2dw,l − 2du,l < 0

(lásd még 13.7. ábra). A szummán kívüli tagok, valamint a szummán belül az l

(13.91)

= k és m = i

  esetek pedig pontosan 0-ra összegzodnek, így bizonyítottuk, hogy a (13.90) egyenlotlenség fennáll.

571

13.5. Törzsfakészítés távolságon alapuló algoritmusokkal m

i

l

v

w m

m

j

k

13.8. ábra. Az m csúcsok lehetséges elhelyezkedése a fán.

Ezután a 13.8. tételt indirekt módon bizonyítjuk. Tegyük fel, hogy az i-t és j-t nem  csúcs választja el, de si, j minimális. A fentiekbol  következik, hogy sem iegyetlen belso  csúcs választ el i-tol,  illetve hez, sem j-hez nem található olyan csúcs, melyet csak egy belso  Keressünk olyan k és l párt, melyet csak egyetlen w belso  csúcs választ el, i-t w-vel j-tol.  út és i-t j-vel összeköto  út utolsó közös csúcsa pedig legyen v. si, j minimalitásából összeköto sk,l

− si, j > 0 .

(13.92)

Ezt átrendezve kapjuk, hogy

X (dk,l

− dm ,k − dm ,l ) − 2dk,l − 1

X (di, j

1

− dm ,i − dm ,k ) + 2di, j > 0 . 2

2

(13.93)

m 2 , i, j

m1 ,k ,l

= k, m1 = l, m2 = i és m2 = j esetek pontosan = m1 = m2 , i, j, k, l esetekben a kérdéses kifejezés

A szummákon kívüli tagok, valamint az m1  0-ra összegzodnek. A többi m

dk,l

− dm,k − dm,l − di, j + dm,i + dm,k .

(13.94)

 úton kapcsolódik az i, j, k és l levelek által kifeszített részfához, Ha m az i-t j-vel összeköto akkor a (13.94) kifejezés mindig negatív lesz (lásd 13.8. ábra). Nevezzük ezen m csúcsokat  I. esetnek. Ha m a v és w közötti úton kötodik be, akkor a (13.94) kifejezés lehet pozitív. Nevezzük ezen eseteket II. esetnek. Mivel a teljes kifejezésnek pozitívnak kell lennie, ezért adódik, hogy a II. esetek száma több kell, hogy legyen, mint az I. esetek száma.

0

 úton van egy v csúcs, és ebbol  kiindulva találunk Tudjuk, hogy az i-t v-vel összeköto

0

0

0  csúcs választ el. Ezekre megint a II. olyan k és l csúcsokat, melyeket csak egyetlen w belso esetek száma több kell, hogy legyen, mint az I. esetek száma, de ezzel ellentmondásra jutunk a k és l csúcsok esetével. Így i és j szomszédok kell, hogy legyenek, és ezzel bizonyítottuk a 13.8 tételt.

Gyakorlatok 13.5-1. Mutassuk meg, hogy ultrametrikában bármely három csúcsból származó három tá azonos, a harmadik pedig ezeknél kisebb. Bizonyítsuk volság vagy mind azonos, vagy ketto  be az additív metrikák esetében a tetszoleges négy csúcsból származó távolságösszegekre fennálló analóg állítást is. 13.5-2. Mutassuk meg, hogy minden ultrametrika egyben additív metrika is. 13.5-3. Adjunk példát olyan metrikára, amely nem additív. 13.5-4. Mutassuk meg, hogy minden additív metrika euklideszi.

572

13. Bioinformatika

13.5-5. Adjuk meg a pontos képletet, amely a centroid módszer esetében meghatározza du,k -t di, j , di,k és d j,k segítségével.   13.5-6. Mutassuk meg, hogy a csúcsok számának négyzetével arányos idoben eldöntheto, hogy egy metrika additív-e, illetve ultrametrikus-e.

13.6. Válogatott témák Ebben a részben olyan témákkal foglalkozunk, amelyek általában nem szerepelnek bioinformatikai tankönyvekben, vagy csak vázlatosan vannak tárgyalva. Mi is csak a legfontosabb eredményeket említjük meg, és a tételeket nem bizonyítjuk.

13.6.1. Genomok átrendez®dése  génekbol  áll. A kétszálú DNS-nek csak az egyik szála Egy organizmus genomja különbözo a kódoló gén, a másik szál ennek a reverz komplementere. Mivel a DNS irányított, így  egyetlen másolat található a beszélhetünk a gének irányítottságáról is. Ha minden génbol   genomban, akkor a gének sorrendje leírható egy elojeles permutációként, ahol az elojel megadja a kódoló szál irányát.  Ha adva van két genom azonos géntartalommal, elojeles permutációként ábrázolva, akkor a feladat az, hogy keressük meg azt a minimális mutációsorozatot, amely az egyik genomot a másikba transzformálja. Három mutációtípust különböztetünk meg:



Inverzió. Egy inverzió a genom egy darabját megfordítja. Az adott darabon a gének  sorrendje, és a leolvasási irány, azaz az elojel is megváltozik.



Transzpozíció. Egy transzpozíció a genom egy darabját egy másik helyre teszi át, úgy, hogy a gének leolvasási iránya nem változik meg.



Invertált transzpozíció. Ennek hatására nem csak a genom egy darabjának a helyzete változik meg, de az elmozdított darab leolvasási iránya is megváltozik. Ha feltesszük, hogy csak inverziók történtek, akkor meg tudunk adni egy

Θ(n2 )

ideju 

algoritmust, amely meghatároz egy olyan minimális mutációsorozatot, amely az egyik ge a szükséges mutációk száma nomot a másikba transzformálja, sot,

  Θ(n) idoben eldöntheto,

ahol n a gének száma. Ha más, vagy többfajta mutációtípust veszünk gyelembe, akkor a probléma bonyolultsága nem ismert. Transzpozíciókra a legjobb közelítés egy 1.5-közelítés. Ha mind a három  algoritmus. fajta mutációt gyelembe vesszük, akkor a legjobb eredmény egy 2-közelíto Ezenkívül súlyozott mutációkra létezik egy (1

+  )-közelítés

is, de a súlyok specialitása

miatt tudjuk, hogy egy legkisebb súlyú mutációsorozatban nem lesz invertált transzpozíció.  Ha az elojeleket nem ismerjük, és csak inverziókat veszünk gyelembe, akkor a probléma bizonyítottan NP-teljes. Ugyanígy NP-teljes probléma az optimális inverziós medián   megtalálása három elojeles permutáció esetében. Az optimális inverziós medián az az elo jeles permutáció, melynek a három elojeles permutációtól vett távolságainak az összege minimális. Az alábbiakban vázoljuk a két genom inverziós távolságának meghatározására szolgáló elméletet, az úgynevezett Hannenhalli–Pevzner-elméletet. Ahelyett, hogy egy ciót transzformálnánk a

π2

permutációba, a

π−2 1 π1 -et

π1

permutá-

transzformáljuk az identikus permu-

573

13.6. Válogatott témák

0

2

1 -1

13.9. ábra. A

−1, +2, +5, +3, +4

3

4

+2

9

10 7

+5

8

+3

5

6

11

+4

  elojeles permutáció ábrázolása nem elojeles permutációként, és a permutáció

töréspontgráfja.

tációba. Egyszeru  csoportelméleti okoskodásból következik, hogy a két feladat egymással ekvivalens. Ezért feltesszük, hogy a két genomból a keresett tároztuk, a továbbiakban ezt

π-vel jelöljük.

π−2 1 π1 permutációt már megha-

  Egy n elemu  elojeles permutációt egy 2n hosszú elojel nélküli permutációval ábrázo-

+i-t lecserélünk egy 2i − 1, 2i párra, minden −i-t pedig egy − 1 párra. Ezenfelül az így kapott permutációt 0 és 2n + 1 közé keretezzük. Ezután el-

 lunk a következoképen. Minden 2i, 2i

 készítjük az úgynevezett töréspont-gráfot. Ennek csúcsai a nem elojeles permutáció elemei, beleértve a 0-t és a (2n + 1)-et is. A permutáció két elemét egy egyenes vonallal kötjük össze, ha a különbségük abszolútértéke nagyobb, mint egy. Valamint két csúcsot egy ívvel kötünk össze, ha egymás utáni számok, de a permutációban nem egymás után állnak. Egy példát adunk meg a 13.9. ábrán. Könnyen belátható, hogy a töréspont-gráfot egyértelmuen  fel lehet bontani körökre, a körökben az egyenes élek és ívek felváltva jönnek. Egy kört irányítottnak hívunk, ha egy, a körön megtett séta során legalább egy egyenes élen balról jobbra, és legalább egy egyenes élen jobbról balra is haladtunk. Minden más kör irányítatlan. Két kör átfed, ha valamely íveik szükségképpen metszik egymást. A permutáció átfedési gráfjainak a csúcsai a töréspont-gráf körei, és két csúcs akkor van összekötve, ha a töréspont-gráfban a két kör metszi egymást. Az átfedési gráf komponensekre bomlik, egy komponens irányított, ha van benne irányított kör, egyébként irányítatlan. Az irányítatlan komponensek közül nem-gátaknak hívjuk azokat, amelyekre a töréspont-gráfon van két olyan irányítatlan komponens, amelyet az adott komponens elválaszt egymástól. Itt az el nem tudunk választáson azt értjük, hogy az egyik irányítatlan komponens valamely ívébol  vonal felett úgy átmenni a másik irányítatlan komponens valamely a csúcsokat összeköto ívéhez, hogy ne metszenénk a nem-gát valamely ívét. A többi irányított komponenst gátnak hívjuk. A gátak közül szupergátaknak hívjuk azokat, amelyeket ha kitörlünk, akkor valamely  amikor a nem-gát pontosan az adott nem-gát gáttá válik. Ez olyan esetekben fordul elo,  Egy permutációt erodnek  gátat választja el más nem-irányított komponensektol. hívunk, ha páratlan számú gátja van, és ezek mindegyike szupergát. 13.9. tétel. Legyen adva egy

π elojeles  permutáció. Inverziók egy optimális sorozata, amely

ezt a permutációt rendezi, bπ

− cπ + hπ +



(13.95)

mutációból áll, ahol bπ a töréspont-gráfban az egyenes élek száma, cπ a töréspont-gráfban a körök száma, hπ a gátak száma, és fπ

= 1, ha π erod,  egyébként pedig 0.

574

13. Bioinformatika

A tételt itt nem bizonyítjuk.  mennyiséget meg lehet A (13.95) képletben szereplo

 Θ(n) idoben határozni, ahol n az

 elojeles permutáció mérete.  Nyílván bπ és cπ kiszámolható O(n) idoben. A nehéz rész hπ és fπ kiszámolása. A problémát az okozza, hogy az átfedési gráfban az élek száma lehet

Ω(n2 ).

Ezért a gyors

algoritmus nem határozza meg a teljes átfedési gráfot, hanem csak minden komponensén  részfát. egy feszíto

13.6.2. Sörétes-puska nukleinsavleolvasás Egy genom DNS-e általában milliós nagyságrendu,  vagy még több nukleinsavból áll. Egy biokémiai technikával meghatározható a DNS egyik végén található nukleinsavak sorrendje,  de a leolvasási bizonytalanság növekszik, ahogy haladunk a szekvenciában elore, és kb. 500 nukleinsav után a leolvasás teljesen bizonytalanná válik.   számos kópiát Ezt a biokémiai problémát a következoképpen oldják meg. A DNS-bol vesznek, és ezek mindegyikét véletlen módon széttördelik olyan méretu  részekre, melyet az   részletekbol  kell elobb leírt technikával aztán már meg lehet határozni. Ezek után az átfedo összerakni az eredeti hosszú szekvenciát. Ezt a technikát hívjuk sörétes-puska nukleinsavleolvasásnak, angolul shotgun sequencing-nek. Matematikailag úgy lehet deniálni a feladatot, hogy adott szekvenciáknak keressük a legrövidebb közös szuperszekvenciáját. Egy B szekvencia szuperszekvenciája A-nak, ha A  részét részszekvenciája B-nek (részszekvencián egy szekvencia nem feltétlenül összefüggo értjük). Maier bebizonyította, hogy a legrövidebb szuperszekvencia NP-teljes probléma, ha az ábécé mérete legalább 5, és sejtése szerint ugyanez a helyzet a legalább háromelemu   ábécék esetén is. Késobb megmutatták, hogy a feladat minden nem triviális ábécére NPteljes. Hasonló a legrövidebb közös szuperstring probléma, ami szintén NP-teljes (részstrin részét értjük). Ez utóbbi probléma az, ami igazán biológen egy szekvencia összefüggo  stringeket keresünk. A megoldásra számos közelíto  algoritgiailag érdekes, hiszen átfedo mus született. Egy mohó algoritmus minden stringpárra megkeresi a maximális átfedéseket, majd ezt próbálja mohó módon összefuzni  egy legrövidebb szuperstringgé. Az algoritmus futási ideje O(Nm), ahol N a szekvenciák száma, m pedig a szekvenciák összhossza. Az így megtalált szuperstring mérete bizonyítottan kisebb, mint 4n, ahol n a legrövidebb szuper és a sejtés az, hogy string hossza. Egy továbbfejlesztett algoritmus bizonyítottan 3-közelíto, valójában sose kapunk 2n-nél hosszabb szuperstringet. A sörétes-puska nukleinsav-leolvasás során a nukleinsavak meghatározása nem tökéle tes, elofordulhatnak beszúrások, törlések és cserék is a meghatározás közben. Ezért Jiang  közös szuperstring problémát. Kececioglu és Myers és Li javasolta a legrövidebb k-közelíto egy programcsomagot dolgozott ki, amelyben számos heurisztikus algoritmust megvalósítottak a probléma megoldására.

Gyakorlatok  13.6-1. Mutassuk meg, hogy ha egy permutáció erod, akkor legalább három szupergát van benne.  kell egy erodnek  13.6-2. Legalább hány elembol állnia?

575

13. Feladatok

Feladatok 13-1. Konkáv Smith–Waterman Adjuk meg a Smith–Waterman algoritmust konkáv résbüntetésekre. 13-2. Konkáv Spouge Adjuk meg Spouge algoritmusát konkáv résbüntetésekre. 13-3. Kiszolgálás benzinkútnál Egy benzinkútnál két sorban állnak a kocsik. Mindegyik kocsit vagy gázolajjal vagy benzinnel kell kiszolgálni. Egyszerre legfeljebb két kocsit szolgálhatunk ki, de csak akkor, ha  üzemanyagot igényel, és a két sor elso  kocsijairól van szó, vagy vaa két kocsi különbözo  két kocsijáról. Akár egy, akár két kocsit szolgálunk ki egyszerre, a két lamelyik sor elso folyamat kiszolgálási ideje ugyanakkora. Adjunk meg egy páros rejtett Markov-folyamatot, amelyre a Viterbi-algoritmus egy legrövidebb kiszolgálási tervet határoz meg. 13-4. Rejtett Markov-modellek momentumai Adott egy szekvencia és egy rejtett Markov-modell. Számoljuk ki a rejtett Markovmodellben az adott szekvenciát kibocsátó utak valószínuségének  a várható értékét, varianciáját, k-adik momentumát. 13-5. Sztochasztikus környezetfüggetlen nyelvtanok momentumai Adott egy szekvencia és egy sztochasztikus környezetfüggetlen nyelvtan. Számoljuk ki az  levezetések valószínuségeinek adott nyelvtanban a szekvenciát levezeto  a várható értékét, varianciáját, k-adik momentumát. 13-6. Rejtett Markov-modellek együttes kibocsátási valószínusége  2

 Ki lehet számolni ezt a valószínuséget  O((n1 n2 ) ) idoben? 13-7. Rendezo  inverziók   inverzióknak hívjuk azokat az inverziókat, ameEgy adott elojeles permutációban rendezo  lépései egy minimális hosszúságú rendezo  sorozatnak. Hogyan változtathatja lyek kezdo  inverzió a töréspont gráfban a körök, töréspontok és a gátak számát? meg egy rendezo

Megjegyzések a fejezethez  Dinamikus programozási algoritmust biológiai szekvenciák hasonlóságára eloször Needle  függvényre Waterman man és Wunch adott meg 1970-ben [344]. Tetszoleges résbünteto  függvényekre és munkatársai adtak algoritmust [487]. Gotoh algoritmusa affin résbünteto  függvény ötlete Watermantól származik 1982-ben jelent meg [165], a konkáv résbünteto  [486], mellyel késobb Miller és Myers [332], valamint Galil és Giancarlo [332] foglalko függvény biológiailag helyesebb, zott. Bár empirikus adatok alapján a konkáv résbünteto  függvényt használják, pl. a Clustal-W nevu mégis a leggyakrabban az affin résbünteto  nép programban is [465]. szeru  szekvenciailleszto A többszörös szekvenciaillesztés ötlete Sankofftól származik [411], mely a bioinformatika egyik központi feladata lett [182]. Bebizonyították, hogy a többszörös szekvenciaillesztés NP-teljes probléma [484], így a gyakorlatban heurisztikus módszereket alkalmaznak. A legelterjedtebb heurisztika az iteratív illesztés, ez alapján muködik  a fent említett Clustal-W is.  Hirschberg algoritmusát eloször leghosszabb közös részszekvencia megkeresésére

576

13. Bioinformatika

használták [207], de mára számos bioinformatikai algoritmusban szerepel, pl. Doublescan  kimerítoen  [324]. A szekvenciaillesztés további algoritmikai elemzésérol ír Guseld [182]. A sztochasztikus nyelvtanok és bioinformatikai alkalmazásuk a központi témája Durbin, Eddy, Krogh és Mitchison népszeru  könyvének, melyet számos egyetem bioinformatika oktatásában alapkönyvként használnak [116]. Formális nyelvekkel, nyelvtanokkal foglalkozó magyar nyelvu  tankönyv Bach Iván [25] és Fülöp Zoltán [131] muve,  valamint [90]. Az osztályozó algoritmusok összehasonlításáról részletesen olvashatunk Podani János  ok  gyelkönyvében [374]. A logenetika és a logenetikai algoritmusok iránt érdeklod mébe ajánljuk Felsenstein [126], valamint Semple és Steel [424] könyveit.  Kevéssé olvasmányos, de sok információt tartalmaz a genomátrendezodési algoritmusokról Pevzner könyve [368]. Stephen String searching” címu  könyvében részletesen foglalkozik a legrövidebb szu” perstring problémájával. A könyvben számos kiváló referenciát és az algoritmusok részletes leírásait is megtaláljuk [437].  oknek  Az alábbi megjegyzések a téma iránt kifejezetten érdeklod szólnak. Két string edit távolságán a minimális számú beszúrás-törlések számát értjük. Két string edit távolságának a kiszámolására van

Θ(l2 )-nél

gyorsabb módszer, amely a négy orosz ”  közül csak egy gyorsítása” néven híresült el, habár a négy egykori szovjetúnió-beli szerzo volt orosz nemzetiségu  [18]. Az algoritmus futási ideje O(n

2

/ lg(n)),

azonban gyakorlati

 alkalmazásokban eloforduló szekvenciahosszakra lassabb, mint a hagyományos dinamikus programozási algoritmusok. A leghosszabb közös részszekvenciára használt dinamikus programozási algoritmus a  két szekvencia hosszainak szorzatával arányos idoben fut, hasonlóan a szekvenciák illesztéseire használt algoritmushoz. Hunt és Szymanski módszere ezzel szemben egy olyan gráfot  melynek csúcsai a két összehasonlítandó szekvencia, A és B karakterei, és ai -t ponállít elo,

= b j . Ezt a gráfot használva létezik olyan algoritmus, Θ((r + n) lg(n)), ahol r a gráf éleinek a száma, n pedig a gráf csúcsainak

tosan akkor köti össze él b j -vel, ha ai melynek futási ideje

2

a száma, azaz a két szekvencia hossza [215]. Habár így az algoritmus futási ideje O(n lg n), számos alkalmazásban a behúzott élek száma a szekvenciák hosszával egyenesen arányos.  O(n lg n) lesz, ami lényegesen jobb a kvadratikus ideju Ekkor a futási ido  algoritmusnál. A saroklevágási technika egyik fejlett változata az úgynevezett diagonális kiterjesztés. A diagonális kiterjesztés a dinamikus programozási táblázatot átlós irányban tölti ki, és nem igényel tesztértéket. Ilyen algoritmusra példa Wu és munkatársainak az algoritmusa [501]. A Unix

diff utasításában használt algoritmus szintén diagonális kiterjesztésen alapul [331], + m + de2 ), ahol n és m a két összehasonlítandó

melynek az átlagos számolási ideje O(n

szekvencia hossza, de pedig a két szekvencia edit távolsága.  algoritmus egy rövid P stringet keres meg egy A Knuth–Morris–Pratt stringkereso hosszú M stringben, és

Θ( p + m)

 idoben fut, ahol p és m a két szekvencia hossza [261].

Landau és Vishkin módosított algoritmusa minden olyan illesztést megtalál M-ben, amely  [277]. Az algoritmus futási ideje legfeljebb k helyen tér el P-tol riaigénye pedig

Θ(k( p lg( p) + m)), memó-

Θ(k( p + m)).

Bár a szekvenciaillesztésre legelterjedtebb algoritmusok dinamikus programozással muködnek,  megadható szekvenciák optimális illesztése egész lineáris programozással is. Az  ötlet Kececioglu és munkatársaitól származik [250]. A módszert kiterjesztették tetszoleges  függvényre is [10]. Az egész értéku  programozással kapcsolatos algoritmusokról résbünteto  cikket Lancia [276]. A DiAlign szintén nem dinamikus programozáson alapul írt áttekinto

577

13. Megjegyzések a fejezethez

[337]. A szekvenciák strukturális illesztése csak a fehérjék három dimenziós szerkezetét veszi gyelembe. Olyan szekvenciaillesztést keresünk, melyben a réseket büntetjük, az összeillesztett karaktereket viszont nem hasonlóság vagy távolság alapján értékeljük, hanem az alapján, hogy a három dimenziós térszerkezetben az összeillesztett aminosavak mennyire hozhatóak fedésbe a szerkezetek forgatásával. Számos algoritmust dolgoztak ki strukturális szekvenciaillesztésre, ezek közül az egyik legnépszerubb  a Kombinatorikus Kiterjesztés (CE) algoritmus [430].  Egy adott fa topológiára a Maximum Likelihood címkézés polinomiális idoben meg csomagba, a adható [378]. Ez az algoritmus az egyik legelterjedtebb logenetikai elemzo PAML-ba is bekerült (http://abacus.gene.ucl.ac.uk/software/paml.html). Egy adott fa topológia, élhosszak, szubsztitúciós modell és adott szekvenciák esetén  lineáris idoben ki lehet számolni egy fa likelihoodját Felsenstein algoritmusával. A Maximum Likelihood fa problémája az, hogy adott modell és szekvenciák esetén határozzuk meg  módon, még azt a fa topológiát és élhosszakat, amelyre a likelihood maximális. Meglepo senkinek sem sikerült bizonyítania, hogy ez a probléma NP-teljes lenne, bár ez a sejtés. Azt már sikerült bizonyítani, hogy az Ancestral Maximum Likelihood probléma, amikor nem  csúcsok legvalószínubb csak a fa topológiáját és élhosszait, hanem a belso  címkézését is keressük, NP-teljes [2].  szekvenciailleszto  A két legelterjedtebb, rejtett Markov-modellek alapján muköd  o programcsomag a SAM [213] és a HMMER (http://hmmer.wustl.edu/). Rejtett Markovmodell [364],

alapján páros

 muköd  o

rejtett

genomannotáló

Markov-modellt

programot

használ

fejlesztett

szintén

ki

Pedersen

genomannotálásra

a

és

Hein

Double-

Scan [324], (http://www.sanger.ac.uk/Software/analysis/doublescan/) és a Projector [325], (http://www.sanger.ac.uk/Software/analysis/projector/). Olyan rejtett Markov-modellt, amely evolúciós információk alapján határozza meg a  kibocsátási valószínuségeket,  Goldman, Thorne és Jones publikált eloször [157], fehérjék másodlagos térszerkezetének jóslására. Ez a rejtett Markov-modell szekvenciák illesztett oszlopait bocsátja ki, egy illesztett oszlop kibocsátási valószínuségét  egy evolúciós fa és  egy idofolytonos Markov-modell határozza meg. A kibocsátási valószínuséget  Felsenstein algoritmusával lehet meghatározni. A Knudsen-Hein nyelvtant használja a PFold nevu  program, amely RNS-ek másodlagos térszerkezetét határozza meg [257]. Ez a sztochasztikus környezetfüggetlen nyelvtan szintén illesztett szekvenciákat vezet le, a terminális szimbólumok ezen szekvenciaillesztés illesztett oszlopai. Az s terminális levezetési valószínuségét  egy evolúciós törzsfa és  egy idofolytonos Markov-modell határozza meg, a dFd levezetésben a két d terminális he lyére írandó két oszlop valószínuségét  pedig ugyanezen a törzsfán egy olyan idofolytonos Markov-modell adja meg, melynek állapotai dinukleotidok. Az E algoritmus futási ideje négyzetesen növekszik a rejtett Markov-modell állapo tainak a számával. Azonban nem mindig ez a leghatékonyabb algoritmus. Egy biológiailag fontos többszörös rejtett Markov-modellben az E algoritmus futási ideje 

Θ(5n Ln ), ahol

n a szekvenciák száma, L pedig a szekvenciák hosszának geometriai közepe. Meg lehet adni azonban egy olyan algoritmust, amely

Θ(2n Ln )

 idoben kiszámolja a szekvenciák kibocsá-

 tási valószínuségét  [299, 300]. Nem ismert azonban, hogy erre a modellre a legvalószínubb kibocsátás megkeresésére hasonló gyorsítás megadható-e. Az RNS-ek Zuker-Tinoco [466] modellje térszerkezeti elemeken deniál szabadener-

578

13. Bioinformatika

giát, és egy adott másodlagos térszerkezethez a térszerkezet részeihez rendelt szabadenergiák összegét rendeli. A Zuker–Sankoff-algoritmus [513] sebb energiatartalmú másodlagos térszerkezetet,

Θ(l

2

 Θ(l4 ) idoben találja meg a legki-

) memóriát használva, ahol l az RNS

szekvencia hossza. Ugyanilyen memória- és számolásigényu  a térszerkezetek Boltzmaneloszlásához tartozó partíciófüggvény kiszámolása is [317]. Egy speciális esetben mind az optimális térszerkezet, mind a partíciófüggvény számolása felgyorsítható vábbra is

Θ(l

2

 Θ(l3 ) idore is, to-

) memóriát használva [303].

 a Az RNS-ek azon bázispárosodásait, melyben a párosodó nukleinsavakat összeköto, szekvencia felett haladó ívek metszik egymást, álcsomóknak hívjuk. Az álcsomókat tartalmazó térszerkezetek általános predikciója NP-teljes. Azonban bizonyos speciális álcsomók közül egy optimális álcsomó megkeresésére vannak polinomiális ideju  algoritmusok [9, 302, 390, 471]. Rejtett Markov-modellek és sztochasztikus környezetfüggetlen nyelvtanok együttes kibocsátási valószínuségeinek  meghatározásával foglalkoztak Jagota és munkatársai [226]. A keresett valószínuséget  egy kvadratikus egyenletrendszer megoldásával lehet meghatározni, amelyet csak numerikusan lehet megoldani. Az egyenletrendszerben az ismeretlenek száma 2

V n , ahol V a nemterminálisok száma Chomsky féle normálformában, n pedig a rejtett  megadtak egy iterációt, mely bizonyítottan konvergál a Markov-modell állapotai. A szerzok pontos megoldáshoz, egy iterációs lépés számolási igénye

Θ(V 3 n5 ). Az iteráció konvergen-

 nem szolgálnak analitikus eredménnyel, de azt sejtik, hogy gyors. ciájának a sebességérol Sztochasztikus környezetfüggetlen nyelvtanok generátorfüggvényeit használta RNS térszerkezetek predikcióinak jóságára Markus Nebel. Számos olyan statisztikát sikerült analitikusan kiszámolnia, amelyek korrelálnak a predikció jóságával [343].   illeszRendezett fákhoz hasonlóan rendezett erdoket is lehet illeszteni. Rendezett erdok tésére adtak meg algoritmust Höchsmann és munkatársai. Megmutatták, hogy RNS térszer kezeteket lehet rendezett erdokkel ábrázolni, és ezen ábrázoláson keresztül az RNS térszerkezetek összehasonlíthatóak [197].  módszerek jóságára, és kimutatta, Atteson matematikai deníciót adott a törzsfakészíto hogy bizonyos deníciók alapján a S ´ 

´´  a leheto legjobb módszer [21].

Négy fajra három fa topológiát lehet készíteni, amelyeket quarteteknek hívunk. Ha egy  az eredeti fa topológiáját is meg lehet fára ismerjük az összes quartet topológiát, akkor ebbol  bebizonyították, hogy nem szükséges az összes quartetet megnézni, a közeli határozni. Sot fajok quartetjei is egyértelmuen  meghatározzák a fa topológiáját [120]. Egy genom állhat több DNS szekvenciából, az egyes DNS szekvenciákat kromoszó máknak hívjuk. Genomátrendezodés során nem csak kromoszómán belül, hanem a kromoszómák között is keveredhetnek a gének. Ezekre az úgynevezett transzlokációs mutációkra adott meg

 Θ(n3 ) ideju algoritmust Hannenhalli [192]. Transzlokációs átmérovel és a prob-

léma általánosításával foglalkozik Pisanti és Sagot [373]. A permutációk rendezésének általánosított problémája a minimális generáló szó kere permusése egy véges csoportban. Ez a probléma bizonyítottan NP-teljes [229]. Az elojeles tációk inverziókkal való rendezésén és a transzlokációs távolságon kívül csak egy biológiailag kevésbé releváns problémára van polinomiális ideju  algoritmus, az úgynevezett blokk  átrendezodésekre [76]. Érdekességként megjegyezzük, hogy a Microsoft tulajdonosa, Bill Gates is foglalkozott permutációk rendezésével, speciálisan a prex inverziókkal [150]. A könyvfejezetben csak a legfontosabb témákról írtunk, számos kevésbé fontos, de nagyon érdekes témakört kénytelenek voltunk kihagyni. Ilyen témakörök például a rekombi-

13. Megjegyzések a fejezethez

579

 módszerek, a részleges emésztés, a náció, a pedigré elemzés, a karakteralapú törzsfakészíto fehérjecsavarás, DNS chipek, a tudásábrázolás, a biokémiai hálózatok. Ennek fényében Donald Knuth szavaival [112] zárjuk könyvfejezetünket:

It is hard for me to say condently ” that, after fty more years of explosive growth of computer science, there will still be a lot of fascinating unsolved problems at peoples' ngertips, that it won't be pretty much working on renements of well-explored things. Maybe all of the simple stuff and the really great stuff has been discovered. It may not be true, but I can't predict an unending growth. I can't be as condent about computer science as I can about biology. Biology easily has 500 years of exciting problems to work on, it's at that level.”

14. Ember-gép kölcsönhatás

 deníciót találjuk a témával kapcsolatban: Az interneten a következo

Az ember és számí” tógép közötti együttmuködéssel  foglalkozó tudományág az emberi használatra szánt interaktív számítógépes rendszerek tervezésével, megvalósításával és értékelésével, valamint e  jelenségek tanulmányozásával foglalkozik. . . . E terület legfontosabb téma körül felmerülo  vonatkozásai a következok:

• • •

Az emberek és gépek által elvégzett feladatok közös teljesítménye. Az ember és gép közötti kommunikáció szerkezete. A gépek használatára vonatkozó emberi képességek (például az interfészek tanulhatósága).

• • •

Az interfész programozása és algoritmusai.  technikai kérdések. Az interfészek tervezésekor és kialakításakor felmerülo Az interfészek specikálásának, tervezésének és megvalósításának folyamata.

. . . Az ember és számítógép közötti együttmuködésnek  a fentiek alapján vannak tudományos, technikai és tervezési kérdései.” A fenti témák közül jó néhány csak távolról érinti a klasszikus értelemben vett algorit musok témakörét. Ezért ebben a fejezetben elsosorban olyan esetekre koncentrálunk majd, ahol a gépeknek nagy mennyiségu  számítást kell elvégezniük, az emberek pedig egyfajta  o  és irányító szerepet töltenek be. intelligens ellenorz

14.1. Több választási lehet®séget kínáló rendszerek Az emberek képesek gondolkodni, érezni és érzékelni, és gyorsan tudnak alkalmazkodni egy új szituációhoz. Számolni is tudunk, de abban már nem vagyunk olyan jók. A számí tógépek ezzel szemben kiválók a számolásban, csak úgy falják a biteket és bájtokat. Ok  azonban a számoláson kívül nem nagyon értenek máshoz, például meglehetosen rugalmat  módon lanok. Ha az embernek és a számítógépnek a képességeit és erosségeit megfelelo kombináljuk, az nagyon hatásos teljesítményhez vezethet. Az ilyenfajta csapatmunkának az egyik lehetséges megközelítése az úgynevezett több választási lehetoséges  optimalizálás. Egy ilyen több választási lehetoséget  kínáló rendszer  alternatívát kínál föl, mondjuk kettot,  háresetén a számítógép néhány, könnyen áttekintheto  döntést egy szakérto  mat, vagy esetleg négyet, de semmiképpen sem sokkal többet. A végso

581

14.1. Több választási lehetoséget  kínáló rendszerek

  hozza meg a felkínált lehetoségek közül választva. Ennek a megközelítésnek egyik legfobb  elonye, hogy az ember nincs hatalmas mennyiségu  adattal elárasztva.  A több választási lehetoséget kínáló rendszerek különösen hasznosak lehetnek azoknál  ido  áll rendelkezésre a teljes a valós ideju  problémáknál, amikor alapjában véve elegendo megoldás kiszámolására, de a feladat bizonyos paraméterei ismeretlenek vagy fuzzy jelle  guek.  Ezek konkrét értékét csak egy meglehetosen kései idopontban tudjuk meg, amikor  ido  bonyolult számításokra. Képzeljük el, hogy a döntéshozó valamimár nincs elegendo   lyen több választási lehetoséget adó algoritmus segítségével elore létrehozott néhány meg engedett megoldást. Majd amikor a tényleges adatok birtokába jut, valós idoben kiválaszt ezek közül egyet. Nézzünk egy példát, amelyben egy útvonalat kell megkeresnünk. Tegyük fel, hogy egy   egy PC szoftver kamionsofornek az A pontból a Z-be kell eljutnia. Az út megkezdése elott  utat, és kinyomtatja oket.  segítségével megkeres két-három megfelelo Út közben a rádió  információkat ad az aktuális forgalmi dugókról, illetve az idojárási problémákról. Ezekben   a helyzetekben a kinyomtatott alternatívák segítenek a sofornek, hogy valós idoben egy másik útvonalat válasszon.  alternatív megoldási lehetoségek  A megfelelo megtalálása azonban nem is olyan egyszeru  a számítógép segítségével. A legtermészetesebb megoldási módnak az tunhetne,  ha valamilyen k-legjobb algoritmust alkalmaznánk. Ez azt jelenti, hogy adva van egy diszkrét optimalizálási probléma valamilyen célfüggvénnyel, és a k darab legjobb megoldást kell  kiszámolni egy elore adott k-ra. Az ilyen k-legjobb megoldások azonban általában egymás minimális változtatásaiként jelennek meg, ahelyett, hogy valódi alternatívák lennének. A 14.1. ábra egy tipikus példát mutat erre. Egy 100

× 100 méretu diagramon az volt a

 célunk, hogy rövid útvonalakat találjunk a bal alsó sarokból a jobb felsobe. Az élhosszak véletlen számok, amelyeket nem jelöltünk az ábrán. Az 1000 (!) legrövidebb utat számol Ha az tuk ki, és az ábra ezek unióját mutatja. A hasonlóság az egyes utak között feltun  o. ábrát egy kicsit nagyobb távolságból nézzük, akkor az a benyomásunk támad, mintha azon csak egyetlen útvonal lenne, amit egy bozontos ceruzával rajzoltak. (A 14.2. pontban majd szintén a rövid alternatív útvonalak kiszámítása lesz az egyik legjobb példa.)  Gyakran elofordul, hogy a

 több választási lehetoség” fogalmát egy másik értelemben ”  több választási lehetoséges teszt” értelemben. Ez a dolog teljesen ” mást jelent. A két fogalom közötti különbség a lehetséges megoldások típusában és számáhasználják, mégpedig a ban van:



 A több választási lehetoséges teszt esetén a válaszok közül legalább egy mindig   szakhelyes”, a többi pedig lehet helyes vagy helytelen. A teszt készítoje (egy külso ”  elore  érto) megadja a kérdést, a lehetséges válaszokat, valamint azt, hogy mely válaszok helyesek.



  hogy a lehetAz optimalizálási környezetben semmi nem világos elore. Elképzelheto,   séges megoldások valamennyien megfeleloek, de az is elofordulhat, hogy mindannyian  szakérto,  aki megmondja az embernek, hogy a rosszak. És általában nincs olyan külso választása jó-e vagy sem. Emiatt a bizonytalanság miatt a legtöbb embernek szüksége  van valamennyi kezdeti idore, hogy a több választást kínáló rendszeren belül a saját szerepét megismerje és elfogadja.

582

14. Ember-gép kölcsönhatás

14.1. ábra. 1000 legrövidebb út egy 100

× 100-as rács-gráfban, egymásra nyomtatott megjelenítésben.

14.1.1. Példák több választási lehet®séget kínáló rendszerre  egyre népszerubbek 1. Rövid útvonalak. Az 1990-es évek elejétol  lettek az útvonalválasz tásra megoldást kínáló PC-s programok. 1997-ben a holland AND nevu  cég volt az elso, amelyik olyan programot árult, amelyik nem csak kiszámolta a legjobb” (=legrövidebb ” vagy leggyorsabb) útvonalat, hanem egy vagy két alternatívát is megadott. A felhasználó nak lehetosége volt arra, hogy ezeket az alternatívákat egyszerre, illetve egyiket a másik után lássa. A felhasználó további paramétereket is megadhatott, amelyek az útvonalak vizuális  második illetve harmadik legjobb tulajdonságait befolyásolták. Ilyen volt például az elso,  útvonal színe, vastagsága stb. Az ezzel kapcsolatos munkák F. Berger nevéhez fuz  odnek.  fejlesztett ki egy módszert, amelynek segítségével lineáris struktúrák (pl. utak, vasutak, O folyók, . . . ) azonosíthatók szürkeárnyalatos muholdas  felvételeken. Általában a lehetséges jelöltek nem egyediek, és Berger algoritmusa néhány további alternatív javaslatot is tartalmaz. Berger módszere a rövid alternatív útvonalakat generáló algoritmusokon alapul. 2. Utazóügynök probléma és lyukak fúrása nyomtatott áramköri lapokba. Az utazóügynök probléma esetén adva van N pont, és ismertek a pontok egymástól mért távolságai. A  legrövidebb kör megtalálása. Errol  a problémáról ismert, feladat egy minden pontot érinto, hogy NP-teljes. Ennek a feladatnak az egyik fontos alkalmazása az elektronikai iparban a lyukak fúrása nyomtatott áramköri lapokba. Ez esetben a pontoknak azok a helyek felelnek meg, ahová a lyukakat fúrni kell, és a cél a fúrófej mozgásának a minimalizálása. A gyakorlat azt mutatja, hogy ebben a feladatban nem csak a fúrófej mozgási útvonalának  hossza az egyetlen feltétele a sikernek. Az útvonaltól függoen kisebb-nagyobb feszültsé útvonalak különbözo  gek alakulhatnak ki a nyomtatott áramköri lapkában. A különbözo  feszültségszinteket eredményeznek, amelyeket elore nem nagyon lehet kiszámítani. Ezért   ki célszerunek  tunik  néhány alternatív, kelloen rövid útvonal meghatározása, amelyekbol tudjuk választani azt, amelyik a feszültség minimalizálása szempontjából a legjobb.  motorok rengeteg 3. Internetes kereso  motorok. A legtöbb esetben az internetes kereso találattal térnek vissza, amelyeket egy átlagos felhasználó nem tud, és nem is akar végig-

14.1. Több választási lehetoséget  kínáló rendszerek

583

 motorok tervezoi  számára kulcsfontosságú feladat a megfelelo  nézni. Ezért az ilyen kereso  számú szabálynak tekintheto,  hogy a kapott eredménybeli elso  tíz kivonatok készítése. Elso  találat legyen a leginkább a tárgyhoz tartozó, és legyen kelloen szétszórva az eredményhal mazon belül. Ezen a területen, és az e-kereskedelem területén a több választási lehetoséget kínáló rendszereket szokás tanácsadó rendszereknek is nevezni. 4. Bolygóközi urutak  röppályái. A távoli bolygókra, kis bolygókra, és üstökösökre való urutazás  a

high-tech” kalandok körébe tartozik. Ezeknél a feladatoknál két kulcsfontos”  ságú tényezore kell tekintettel lenni. Az egyiket a költségvetési korlátok jelentik, a másik  pedig az, hogy az urszondákat  különlegesen nagy sebességre kell felgyorsítani, hogy idoben elérjék a céljukat. A rakéták felgyorsításában a gravitáció is segíthet, oly módon, hogy  bolygókhoz egészen közel megy el a röppályájuk. Ezzel idot  és üzemanyagot a közbeeso is lehet megtakarítani. Az utóbbi években ezek a gravitáció által segített röppályák egyre  bonyolultabbak lettek, néha több bolygó-közeli elrepülést is tartalmaztak. A legjelentosebb  példák a következok: a Cassini küldetése a Szaturnuszra a Vénusz-Vénusz-Föld-Jupiter sorozatot tartalmazta, a Rosetta küldetése a 67P/Hurjumov-Geraszimenko” üstökösre a Föld” Mars-Föld-Föld sorozatot, a Messenger küldetése a Merkúrra pedig a Föld-Vénusz-VénuszMerkúr-Merkúr sorozatot. A röppályák kiszámításának tudománya jelenleg abban tud segíteni, hogy egy korábban meghatározott útvonalat nomítson. Ehhez azonban a mérnökök fantázia és kreativitás segítségével ilyen elsodleges,  nek megfelelo nomítható útvonalakat   generálása kell tervezniük. Ezeknek az elsodleges útvonalaknak a számítógéppel történo   még meglehetosen gyerekcipoben jár.  kezdtek elterjedni a pia5. Számítógéppel támogatott sakk. Az 1970-es évek végétol con kapható sakkozó számítógépek. Ezeknek a gépeknek a játékereje fokozatosan növekszik, és ma már a legjobb PC-s programok egy szinten vannak a legjobb sakkozókkal. Az  olyan csapatok azonban, amelyekben emberek és számítógépek is részt vesznek, eroseb illetve csak gépekbol  álló csapatoknál is. E fejezet egyik szerzoje  bek a csak emberekbol,  (Althöfer) több kísérletet végzett több választási lehetoséget kínáló rendszerekkel. Az egyik  sakkprogram fut két fügilyen összeállításban, amelyet 3-agynak nevezünk, két különbözo getlen PC-n. Mindkét program javasol egy lépést, amelyek közül egy (emberi) sakkjátékos  hozza meg a végso  döntést. Néhány kísérlet folyamán a 3-agy kitun  teljeválaszt, vagyis o  o  sítményt ért el. A legfontosabb ezek közül egy 1997-es mérkozés volt, amelyben két, egyen pont alatti játékereju  sakkjátékos (1900-as Élovel)  ként 2550 Élo  program, és egy amator   számú német sakkjátékost, Juszupov nagymestert, akinek Élo  pontja 5-3-ra legyozte az elso  2640 volt. Ezzel a 3-agy átlagos teljesítménye 2700 Élo-pont felettinek felelt meg. Ez után az esemény után a legjobb sakkjátékosok már valahogy nem nagyon akartak a 3-agy csa patok ellen küzdeni. A 3-agy erossége nagyrészt abban rejlik, hogy két különbözo  sakkbeli  tudás kombinálására ad lehetoséget. A számítógépek leginkább a taktikailag helyes lépések  megtalálásában jeleskednek, míg az ember erossége a hosszú távú tervek kiválasztása. Manapság az összes pro sakkjátékos számítógépes programok segítségével készül a  versenyekre, a megnyitásoknak és a partiknak valamilyen több választási lehetoséget kínáló elemzését felhasználva. Még kirívóbb a helyzet a levelezési sakkban, ahol a játékosok hivatalosan is felhasználhatják a számítógép segítségét a játszmáikban. 6. Nyaralási és utazási információk. Amikor valaki a nyaralását tervezi, általában összehasonlít néhány ajánlatot. Mindezt megteheti egy vasútállomáson, egy utazási irodában,  ilyenkor nem vizsgálnak meg több ezer ajánvagy otthon az internetet böngészve. A vevok latot, hanem csak maximum tízet-húszat. Az életben számtalan (elfogadható és kevésbé

584

14. Ember-gép kölcsönhatás

elfogadható) stratégiával találkozhatunk, amelyekkel a cégek, szállodák és légitársaságok megpróbálják a termékeiket a legjobb ajánlatok közé pozicionálni. Egy gyakori példa erre,  hogy néhány légitársaság hihetetlenül rövid utazási idovel teszi közzé az ajánlatát. Ennek az  az egyetlen célja, hogy azokban a szoftverekben, amelyek az A pontból a B pontba történo  szerint csökkeno  sorrendben listázzák, az ajánlat a legelsok  között szeutazásokat menetido  számára, hogy az ilyen trükköket észrevegye, repeljen. Sok esetben nem is egyszeru  a vevo  mutatkozás. amelyeknek a célja a kivonatoló eljárásokban való minél sikeresebbnek tun  o 7. RNS molekulák másodlagos térszerkezetének meghatározása. Az RNS molekulák másodlagos térszerkezetének meghatározása az egyik központi téma a számítógépes bioló gia területén. Az erre vonatkozó legjelentosebb algoritmusok a dinamikus programozáson  alapulnak. Léteznek on-line adatbázisok, ahonnan valós idoben lehetséges megoldások kér le. hetok

Gyakorlatok  14.1-1. Szerezzünk gyakorlatot a több választási lehetoséget kínáló rendszerekben a FreeCell nevu  türelemjáték segítségével. Töltsük le a BigBlackCell (BBC) nevu  segédprogramot  és ismerkedjünk meg a programmal. a http://www.minet.uni-jena.de/∼BigBlackCell/ címrol Némi gyakorlás után egy átlagos felhasználónak a BBC segítségével óránként legalább 60  FreeCell elofordulást kell megoldania.

14.2. Több lehetséges megoldás el®állítása 14.2.1. Lehetséges megoldások el®állítása heurisztikák és ismételt heurisztikák segítségével Nagyon sok optimalizálási probléma valóban nehéznek mondható, ilyenek például az NPteljes problémák. A pontos, de lassú eljárások, illetve a megbízhatatlan, de gyors heuriszti megoldásokat kák két lehetséges megközelítését adják annak, ahogyan pontos vagy közelíto találhatunk. Ha az a feladatunk, hogy néhány alternatív megoldást hozzunk létre, akkor a  erényt kovácsolhatunk. Általában sokkal több jónak mondható megoldás van, szükségbol  heurisztikák – foleg  mint ahány tökéletes, és a különbözo a véletlen elemeket is tartalmazók – nem mindig ugyanazt a megoldást szolgáltatják. Ezért egy egyszeru  stratégia lehet az, hogy egy vagy több heurisztikát többször alkalmazunk ugyanarra a problémára, és a kapott megoldásokat feljegyezzük. Létrehozhatunk pontosan annyi megoldást, amennyire szükségünk van, de létrehozhatunk többet is, amit az kivonatoló módszerrel javítunk. A kivonatok készítésénél alapveto  tán majd egy megfelelo   szóródása. Ami a szóródást illeti, ehhez szempont a minoség, és a megoldások megfelelo célszeru  a lehetséges megoldások között valamilyen távolsági mértéket bevezetni, valamint  klaszterezo  algoritmusokat használni. megfelelo  o  futtatása Egyetlen heurisztika ismétlod A legtöbb esetben a heurisztika tartalmaz valamilyen mértéku  véletlent. Ez esetben nincs  más teendonk, mint, hogy a heurisztikát egymástól függetlenül többször lefuttassuk, amíg  számú különbözo  megoldást kapunk. Az alábbiakban az utazóügynök problémán fogkello  heurisztikára és a beszúró juk bemutatni ezt a megközelítést. Adunk egy példát a cserélo

14.2. Több lehetséges megoldás eloállítása 

585

heurisztikára, és mindkét esetben rámutatunk a véletlen elemek szerepére. Amennyiben a pontok közötti d(i, j) távolság szimmetrikus, akkor a lokális keresés  cserével egy jól ismert cserélo  heurisztika. Az alábbi pszeudokódban T ( p) jelöli a T kettos vektor p-edik komponensét. L -  (N, d) ´ ´ -- ´ - ¨ ¨ - ´  ´

= (i1 , i2 , . . . , iN ) ≤ p < q ≤ N és q ≥ p + 2, és d(T ( p), T ( p + 1)) + d(T (q), T (q + 1)) > d(T ( p), T (q)) + d(T ( p + 1), T (q + 1)) (A q = N speciális esetben vegyük a q + 1 = 1-et.) do T ← (i1 , . . . , i p , iq , iq−1 , . . . , i p+1 , iq+1 , . . . , iN )

1

generáljunk egy kezdeti véletlen útvonalat T

2

while létezik olyan p és q index, amelyekre 1

3 4

számoljuk ki a T útvonal hosszát, l-et

5

return T , l Ebben a heurisztikában a véletlen elemeket a kezdeti útvonal kiválasztása, valamint az

 beállítások a sorrend jelenti, ahogyan az élpárokat megvizsgáljuk a 2. lépésben. Különbözo  lokális minimumhoz vezetnek. Nagy méretu különbözo  problémák esetén, például 1000 véletlen pontot véve az egység oldalú négyzetben, az Euklideszi távolságot gyelembe véve,  ha 100 független futtatás majdnem 100 különbözo  lokális teljesen normálisnak tekintheto, minimumhoz vezet. Az alábbi pszeudokód egy szabványos beszúró heurisztikát mutat be. B  (N, d) ´  ´ -- ´ - ¨ ¨ - ´  ´ 1

 generáljuk a (i1 , i2 , . . . , iN ) véletlen permutációt az {1, 2, . . . , N } elemekbol

2

T

3

for t

4

← (i1 , i2 ) ← 2 to N − 1 do keressük meg a d(T (r), it+1 )

+ d(it+1 , T (r + 1)) − d(T (r), T (r + 1)) minimumát ∈ {1, . . . , t}. (r = t esetén r + 1 = 1) legyen a minimum r = s-ben T ← (T (1), . . . , T (s), it+1 , T (s + 1), . . . , T (t)) ahol r

5 6

számoljuk ki a T útvonal hosszát, l-et

7

return T , l  Így eljárva az elemeket egyesével szúrjuk be oly módon, hogy a beszúrás után a leheto

legkisebb legyen az új útvonalhossz.  cserénél, a különItt a véletlen elem az N pont permutációja. Hasonlóan, mint a kettos  beállítások különbözo  lokális minimumhoz vezetnek. További véletlen elemet jelentbözo het, ha valamelyik lépésben az optimális beszúrás helye nem egyértelmu.  Néhány modern heurisztika a természettel való hasonlóságon alapul. Ilyen esetekben a  felhasználónak még több lehetosége van. A szimulált hokezelés  esetén néhány köztes megoldást kaphatunk az egyes futtatásokból. Vagy egy genetikus algoritmus egyes futásaiból  generációkat reprezentálhatnak, is kaphatunk néhány megoldást, amelyek akár különbözo akár egy kiválasztott generáció többszörös megoldásait.  heurisztikák ismételt futtatására egy speciális technikát jelent a lokális opA cserélo  timumok perturbálása. Eloször lefuttatjuk az eljárást egy lokális optimum megtalálására. Ezután ezen az optimumon véletlenszeru  lokális változtatásokat végzünk. Az így kapott

586

14. Ember-gép kölcsönhatás

megoldásból kiindulva újra elindítunk egy lokális keresést, ami egy második lokális optimumhoz vezet. Ezen ismét véletlenszeru  változtatásokat végzünk, és így tovább. A véletlenszeru  változtatások mértéke azt fogja befolyásolni, hogy a lokális optimumok sorozata  egymástól. mennyire lesz különbözo Még a determinisztikus heurisztikák alkalmazása esetén is vannak esetek, amikor több  lehetséges megoldást kaphatunk. A holtversenyes esetekben például a választástól függoen más-más eredményre jutunk, vagy a számolás pontossága (a kerekítési szabályok) is oko módszereket, amelyekben a zóhat ilyesmit. A 14.2.6. pontban tárgyaljuk azokat a bünteto  o  paramétereket mesterségesen megváltoztatjuk (pl. növeljük az élhosszakat) az ismétlod  futtatások során. Az úgynevezett tetszoleges futási ideju  algoritmusokban, mint például a keresési fa iteratív mélyítése, a köztes megoldások használhatók fel alternatív jelöltekként.  heurisztikák alkalmazásával A lehetséges megoldások összegyujtése  különbözo Ha ugyanarra a problémára több heurisztika is ismeretes, akkor mindegyikük szolgáltathat egy vagy több megoldásjelöltet. A 14.1.1. pont 5. részében ismertetett 3-agy összeállítás egy jó példája a több választást kínáló rendszereknek, amelyek több program futását használják  gépeken is futnak. (A fel. Az ott említett két program független egymástól, és különbözo  versenysakkot szigorú idokorlátok keretei között játsszák, ahol 3 perc jut egy lépésre. Ha a  két programot egy gépen futtatnánk multitaszk üzemmódban, azzal számítási eroforrásokat  veszítenénk, és ez Heinz szerint körülbelül 60-80 Élo-pontba kerülne.) A 3-agy kongurációnál használt sakkprogramok normális, megvásárolható programok, nem olyanok, amiket speciálisan a több választást kínáló rendszer számára terveztek. Minden program tartalmazhat hibákat. A független programokat használó, több válasz  tási lehetoséget kínáló rendszerek egy nyilvánvaló elonnyel rendelkeznek a katasztrofális hibák tekintetében. Ha két független programot futtatunk, amelyek mindegyikénél p a katasztrofális hiba bekövetkezésének a valószínusége,  akkor az együttes bekövetkezés valószínu 2

 o  szerepet betölto  ember általában észre fogja venni, amisége p -re csökken. Egy ellenorz kor a megoldásjelöltek katasztrofális hibát tartalmaznak. Ezért az az eset, amikor az egyik megoldás normális, a másik pedig katasztrofális (ennek valószínusége  egyébként 2 p( p − 1))  nem fog hibához vezetni. Egy további elonyt jelent még, hogy ilyenkor a programoknak nem kell valamiféle k-legjobb vagy k-választást megvalósító módszert tartalmazniuk. A gépek által kínált egybevágó javaslatokat lehet úgy tekinteni, mint annak a jelét, hogy az adott  megoldás éppen megfelelo.  A független programokat használó, több választási lehetoséget kínáló rendszereknek azonban vannak gyenge pontjai is:



 tudásbeli különbség van, akkor a döntést hozó személy Ha a programok között jelentos nehezen fogja rászánni magát, hogy a gyengébb gép megoldását válassza.



 programok javaslatai egymással inkompaTöbb lépéses muveletek  esetén a különbözo tibilisek lehetnek.



  és a futtatott programoktól függoen,  Gyakran elofordul, hogy az operációs rendszertol egy PC nem elég stabilan muködik  multitaszk üzemmódban. És természetesen az sem mindig biztosított, hogy a programok valóban függetlenek

 egymástól. Az 1990-es évek végén például Németországban számos közúti útvonaltervezo  nevekkel és interfészekkel. Valójában azonban mindegyik program volt kapható különbözo négy független program kernel és adatbázis valamelyikén alapult.

587

14.2. Több lehetséges megoldás eloállítása 

14.2.2. Büntet® módszer egzakt algoritmusokkal  megoldások megtalálására az úgyValamivel jobban kézben tartott módot ad a szóba jövo  példán kenevezett bünteto  módszer. Ennek a módszernek az alapötletét az útvonaltervezo  útvonalból és keressünk resztül illusztráljuk. Induljunk ki egy R1 optimális (vagy megfelelo)  legjobban kielégíti az alábbi két feltételt. egy R2 alternatív megoldást, amelyik a leheto (i)

  esetben nincs R2 -nek megfelelonek kell lennie a célfüggvény szempontjából. Ellenkezo  értelme, hogy R2 -t válasszuk. A példánknál maradva, most az útvonal hossza az elsodleges cél.

 esetben nem (ii) R2 -nek nem szabad nagyon hasonlítania az eredeti megoldásra. Ellenkezo beszélhetünk valódi alternatíváról. Az úgynevezett mikro mutációk esetén nagy az esélye annak, hogy az összes egymáshoz hasonló megoldásjelölt ugyanazzal a gyenge ponttal rendelkezik. A példánkban a

hasonlóság mérésére” alkalmas lehet az R1 -ben ” és R2 -ben is megtalálható közös részek hossza. Ez azt jelenti, hogy R2 -nek rövidnek kell lennie, de emellett R1 -gyel kevés közös részének kell lennie. E cél elérése érdekében két célfüggvény kombinációját fogjuk használni. Az egyik az útvonal hossza, a másik a közös részek hossza. Ezt úgy fogjuk elérni, hogy az R1 -beli szakaszokat büntetni fogjuk, és ennek a módosított legrövidebb útvonal problémá nak keressük az R2 megoldását. A büntetés mértékének változtatásával különbözoképpen súlyozhatjuk az (i) és (ii) feltételeket. Az egyik legegyszerubb  megközelítés az, amikor egy relatív bünteto  tényezot  használunk. Ez azt jelenti, hogy az R1 -hez tartozó szakaszok hosszát megszorozzuk 1

+ ε-nal.

B  - -´-  -´  (G , s, t, ε) ¨ ´ ¨  1

 t-be vezeto  R1 legrövidebb utat a G keressük meg az s-bol

2

for

3

∀e ∈

= (V, E , w) súlyozott gráfban

E

do if e R1 -hez tartozik

4

b(e) then w

5

b(e) else w

← w(e) · (1 + ε) ← w(e)

6

b = (V, E , w  t-be vezeto  R2 legrövidebb utat a G b) módosított gráfban keressük meg az s-bol

7

számítsuk ki az R2 módosítás nélküli w(R2 ) hosszát

8

return (R1 , R2 ) és (w(R1 ), w(R2 )) Tekintsük az alábbi példát.

14.1. példa. Adott egy G

= (V, E) gráf súlyozott élhosszakkal. A 14.2. ábrán az élek hosszát a melléjük

 T -be vezeto  legrövidebb út PD , amelynek hossza 23, és a következo  írt számok jelzik. Az S -bol csúcsokat érinti: S - A - C - D - F - T . Ha a PD éleinek hosszát megszorozzuk 1.1-del, és megoldjuk a kapott legrövidebb út problémát, akkor a P B útvonalat kapjuk, amelynek módosított hossza 25, eredeti  csúcsokat érinti: S - A - B - F - T . P B és PD közös részei az S - A és F hossza 23.7, és a következo T szakaszok, amelyeknek összhossza 13.

 ε méretét mindig a körülményeknek megfeleloen kell megválasztani. Az AND cég pi programjában a legrövidebb útvonal minden szakaszát 1.2-vel acon kapható útvonaltervezo szorozták meg, vagyis

ε = 0.2. Az alternatív útvonal ezek alapján kerül kiszámításra. Ber-

 lineáris struktúrák (utcák, folyók, reptéri ger munkájában a muholdas  felvételeken szereplo

588

14. Ember-gép kölcsönhatás

8.7 A 9

B 8

2 1

S

C

1

D

1.1

4

1

9

F

T

8

E 9 G

H

14.2. ábra. A14.1., 14.2. és 14.6. példákhoz tartozó gráf.

kifutópályák) felismerése szintén a legrövidebb útvonal módszerrel történik. Itt

ε =

1.0

 választásnak, ami érdekes alternatív megoldásokat adott. bizonyult megfelelo  tényezo  helyett használhatunk additív bünteto A relatív bünteto  tagot is. Ez azt jelenti, hogy minden olyan élhez, amelyet büntetni szeretnénk, hozzáadunk egy konstans

ε-t.

A fenti algoritmusban ekkor csupán a 4. lépést kell megváltoztatnunk az alábbira.



b(e) then w

4

← w(e) + ε

14.2. példa. Adott a 14.1. példából már ismert G

=

 T -be (V, E) gráf (lásd a 14.2. ábrán). Az S -bol

 legrövidebb út most is PD , amelynek hossza 23, és amely a következo  csúcsokat érinti: S - A vezeto - C - D - F - T . Ha a PD éleihez hozzáadunk 0.1-et és megoldjuk a kapott legrövidebb út problémát,  akkor a PE útvonalat kapjuk, amelynek módosított hossza 23.4, eredeti hossza 23.1, és a következo csúcsokat érinti: S - A - C - E - F - T . PD -nek és PE -nek három közös éle van.

 tag nem rosszabb a relatívnál. Az utóbbinak, a mulAlapjában véve az additív bünteto  tiplikatívnak azonban megvan az az elonye, hogy nem érzékeny az élek mesterséges kettévágására.  módszerek általánosításához hasznos a következo  deníció. A bünteto 14.1. deníció (összeg típusú optimalizálási probléma).

Legyen E egy tetszoleges  véges

halmaz, S pedig egy E részhalmazaiból álló halmaz. E-t alaphalmaznak nevezzük, S elemeit pedig E megengedett részhalmazainak. Legyen w : E vény az E-n. Minden B

∈ S -re legyen w(B) =

P

e∈ B

→ R egy valós értéku súlyfügg-

w(e).

A min w(B) optimalizálási problémát összeg típusú optimalizálási problémának, vagy B∈S

röviden csak

P

-típusú problémának nevezzük.

Megjegyzések. 1. 2.

A B

∈S

elemeket szokás megengedett megoldásoknak is nevezni.

Minden maximalizálási probléma átalakítható minimalizálási problémává ha w-t vel helyettesítjük. Ezért a maximalizálási problémákat is nevezni.

P

−w-

-típusú problémának fogjuk

589

14.2. Több lehetséges megoldás eloállítása 

14.2.3. Példák

P

-típusú problémákra



Legrövidebb út probléma



Hozzárendelési probléma



Utazóügynök probléma



Hátizsák probléma



Sorozat csoportosítási probléma

14.3. példa. Tekintsük a hátizsák problémát. Adott egy I = { I1 , I2 , . . . , In } elemhalmaz, egy w : I → R+ súlyfüggvény, egy v : I → R+ értékfüggvény és a hátizsák kapacitása C. A feladat az, hogy határozzuk meg azt a legértékesebb elemhalmazt, amelyek összsúlya nem haladja meg a hátizsák kapacitását. Ha I-t tekintjük alaphalmaznak, S pedig azon részhalmazok összessége, amelyek összsúlya ki mint C, akkor egy sebb vagy egyenlo, B

P

-típusú problémához jutunk. Maximalizálnunk kell v(B)-t

∈ S -re.

P 14.2.4. A büntet® módszer absztrakt megfogalmazása -típusú problémákra  módszer). Legyen E egy tetszoleges 14.2. deníció (bünteto  halmaz, S pedig álljon E megengedett részhalmazaiból. Legyen w : E

→ R egy valós értéku, 

p : E

→ R≥0 pedig egy nem

negatív valós értéku  függvény az E-n. Minden

ε > 0-ra legyen Bε egy optimális megoldása a min fε (B), B∈S

problémának, ahol fε (B) := w(B)

+ ε · p(B) .

Egy olyan algoritmussal, amelyik képes a büntetés nélküli min w(B) problémát megolB∈S

dani, megtalálhatjuk Bε megoldásait is. Ehhez csak a w függvényt kell módosítanunk, oly módon, hogy minden e



melletti megoldásnak vagy

E-re w(e)-t helyettesítjük w(e)

+ε·

p(e) -vel. Bε -t

ε -büntetés

ε -alternatívának nevezzük. .

Deniáljuk ezen kívül B∞ -t, mint a következo  probléma megoldását:

lex min ( p(B), w(B)) B∈S

(minimalizálás a lexikograkus sorrendnek megfeleloen)  ,

amely a minimális p(B) értékkel rendelkezik, és az ilyen megoldások között minimális w(B) értékkel. Megjegyzés. Amennyiben w és p is pozitív, valós értéku  függvények, ekkor egyfajta szim-



ε-büntetés melletti < ε < ∞) a (w, p) függvénypárra nézve, ha B∗ (1/ε) büntetés melletti megoldás

metria áll fenn az optimális megoldások körében: B pontosan akkor lesz megoldás (0

a ( p, w) függvénypárra nézve.

590

14. Ember-gép kölcsönhatás

 A szimmetria megorzése miatt van értelme deniálni B0 -t, ami optimális megoldása a  problémának: következo lex min (w(B), p(B)) B∈S

.

Ez azt jelenti, hogy B0 nem csak optimális megoldás a w célfüggvényre nézve, hanem az ilyen megoldások között a minimális p értékkel rendelkezik. 14.4. példa. Adjuk meg a formális denícióját a 14.1. példának ebben az absztrakt

P

-típusú meg-

 T -be vezeto  PD legrövidebb utat, és keresünk egy alternatív, jó fogalmazásban. Ismerjük az S -bol  függvényt a következoképpen  megoldást. A p bünteto deniáljuk:

   w(e), p(e) =   0

ha e egyik éle a PD legrövidebb útnak

,

egyébként .

Büntetés melletti megoldások keresése az összes  Gyakran elore nem látható, hogy mely

ε

ε ≥ 0 paraméterre

paraméter mellett kapunk használható alternatív

megoldásokat. Egy oszd meg és uralkodj” jellegu  algoritmussal megtalálhatjuk az összes ”  olyan megoldást, amelyik valamely ε-ra eloállna. Véges S halmazokra megadunk egy hatékony algoritmust, amelyik egy viszonylag kicsi

B⊆S •

 tulajdonságokkal rendelkezo  halmazt állít elo:  megoldásokból álló, a következo

minden B

∈ B

elemre létezik olyan

ε ∈ R+ ∪ {∞},

hogy B optimális megoldás az

ε

elem, hogy B optimális megoldás az

ε

 paraméter mellett; bünteto



minden

ε ∈ R+ ∪ {∞}-re

létezik olyan B

∈ B

 paraméter mellett; bünteto



B a fenti két tulajdonsággal rendelkezo összes halmazrendszer közül a minimális elemszámmal rendelkezik.  paraméter mellett optimális, Egy olyan B megoldást, amelyik legalább egy bünteto

 algoritmus büntetés-optimális megoldásokbüntetés-optimálisnak nevezünk. A következo nak egy olyan halmazát keresi meg, amelyek minden

ε ∈ R+ ∪ {∞}-t lefednek.

B halmaz elemeit rögzített sorrendben ad= ε(1) < ε(2) < · · · < ε(k) = ∞. Az algoritmusnak  ellenoriznie kell, hogy ε(i) < ε(i + 1) esetén ne létezzen olyan köztes ε, ε(i) < ε < ε(i + 1), Az egyszerubb  azonosíthatóság kedvéért a

juk meg (Bε(1) , Bε(2) , . . . , Bε(k) ), ahol 0

 paraméterre sem Bε(i) sem Bε(i+1) nem optimális. Ellenkezo  esetben az hogy erre a bünteto algoritmusnak azonosítania kell legalább egy ilyen

ε-t, és keresnie kell egy ε-büntetés mel-

letti Bε megoldást. Az alábbi pszeudokód 11. lépésében a Border[i] változót akkor állítjuk 1-re, ha kiderül, hogy nem létezik ilyen köztes

ε.

Az alábbiakban látható a pszeudokód, amelyhez néhány megjegyzést is fuztünk.  Algoritmus büntetés-optimális megoldások olyan lyek minden

ε ≥ 0-ra lefedik a következo problémát: min fε (B) B∈S

ahol fε (B)

= w(B) + ε · p(B).

B

sorozatának megtalálására, ame-

591

14.2. Több lehetséges megoldás eloállítása  O--´ --(w, p) 1

 legkisebb számítsuk ki azt a B0 -at, amelyik minimalizálja w(B)-t és p(B)-értéke a leheto

2

 legkisebb számítsuk ki azt a B∞ -t, amelyik minimalizálja p(B)-t és w(B)-értéke a leheto

3

if ( p(B0 )

4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

= p(B∞ )) B ← { B0 } E ← (0) Border← ∅ B B0 minimalizálja a w és p függvényeket és minden ε-ra optimális else do k ← 2 E = (ε(1), ε(2)) ← (0, ∞) Border[1] ← 0 B ← (B0 , B∞ ) while van olyan i ∈ {1, 2, . . . , k − 1} hogy Border[i] = 0. do ε ← (w(Bε(i+1) ) − w(Bε(i) ))/( p(Bε(i) ) − p(Bε(i+1) )) keressünk egy optimális Bε megoldást a ε paraméterhez if fε (Bε ) = fε (Bε(i) ) = fε (Bε(i+1) ) then Border[i] ← 1 else do B ← (Bε(1) , . . . , Bε(i) , Bε , Bε(i+1) , . . . , Bε(k) ) E ← (ε(1), . . . , ε(i), ε, ε(i + 1), . . . , ε(k)) Border ← (Border[1], . . . , Border[i], 0, Border[i + 1], . . . , Border[k − 1] k ← k+1 return B, E, Border then do

Az algoritmus végén

B

 büntetés-optimális megoldások sorozata lesz, az különbözo

E

vektor pedig egymás utáni epszilonokat fog tartalmazni.  tulajdonságokon alapul: A fenti algoritmus a következo

ε-optimális megoldás, akkor létezik olyan IB = [εl , εh ] intervallum (εl , εh ∈ R ∪ {∞}), hogy B optimális minden ε ∈ IB paraméterre, más paraméterre viszont nem

(1) Ha B egy

optimális.

0

 B és B megoldásra, és a hozzájuk tartozó nem üres I B és I B0 intervallu(2) Két különbözo  három eset valamelyike fordulhat elo.  mokra csak a következo

∗ ∗ ∗

IB

=

I B0 . Ez pontosan akkor igaz ha w(B)

= w(B0 ) és

p(B)

=

0

p(B ).

I B és I B0 diszjunktak. IB

∩ IB0 = {ε},

vagyis a metszet egyetlen epszilont tartalmaz. Ez az eset akkor áll

fenn, ha I B és I B0 szomszédos intervallumok. Az E halmaz végessége miatt csak véges sok B



S megengedett megoldás létezik.

 és (2)-bol  következik, Ezért csak véges sok optimalitási intervallum lehet. Így (1)-bol  halmazára: hogy a [0, ∞] intervallumot fel tudjuk osztani intervallumoknak a következo

{[0 = ε1 , ε2 ], [ε2 , ε3 ], . . . , [εk , εk+1 = ∞]}.

Minden intervallumra vonatkozóan külön-

 B megoldásokat kapunk, amelyek optimálisak az intervallumbeli összes bözo

ε-ra. Az

ilyen megoldást az intervallum reprezentánsának nevezzük. (3) Az algoritmus célja, hogy ezeknek az optimalitási intervallumoknak a határait megtalálja, és minden intervallumra találjon egy reprezentáns megoldást. Az iteráció minden

592

14. Ember-gép kölcsönhatás

lépésében vagy egy új intervallum reprezentánsát, vagy két intervallum között egy új határt találunk meg (7-13 lépések). Ha k darab optimalitási intervallumunk van, ahol k



 2k 2, akkor elegendo

−1

darab min w(B) B∈S

+ε·

p(B) típusú problémát megoldani,

hogy valamennyit megvizsgáljuk, és megtaláljuk a reprezentáns megoldásokat.

Az

ε-alternatívák unimodalitási tulajdonsága ε-alternatívát számolunk

Amennyiben csak egy

ki, felmerül a kérdés, hogy milyen bün-

 paramétert használjunk, hogy a teto

 legjobb” alternatív megoldáshoz jussunk. Ha leheto ”  paraméter túl kicsi, az optimális és az alternatív megoldás túlságosan hasonló a bünteto  egymáshoz, és ez nem ad valódi választási lehetoséget. Ha a paraméter túl nagy, az alternatív megoldás túlságosan gyenge lesz. A legjobb választásnak az tunik,  ha  útvonaltervezo  példában. választunk. Ezt fogjuk illusztrálni a következo, 14.5. példa.

közepes” ”

ε-t

 és végpont közötti útvonalat kell megterveznünk. Tegyük fel, hogy egy adott kezdo

 Ismerjük az átlagos utazási idoket minden szakaszra vonatkozóan, és két útvonalat tervezhetünk. Az  utolsó pillanatban ismerjük meg a tényleges utazási idoket, és ekkor választhatjuk ki a gyorsabbat a két jelöltünk közül.  útvonal az, amelyik az átlagos utazási idok  alapján a leggyorsabb, a második pedig Legyen az elso  módszer szerint találtunk. A kérdés az, hogy milyen bünteto  paramétert egy olyan, amit a bünteto használjunk, hogy a gyorsabb út tényleges utazási idejét minimalizálni tudjuk Konkrétan, vegyünk véletlenszeruen  generált példákat a legrövidebb útvonal problémára egy 25

×

25-ös méretu  súlyozott, irányított, rácsos G

=

(V, E , w) gráfban. Az élek súlyainak elosz-

 lása legyen egyenletes a [0, 1] intervallumban. Kiszámoljuk a bal alsó sarokból a jobb felsobe ve minimális súlyú P0 útvonalat. Ezután oly módon büntetjük a P0 éleit, hogy megszorozzuk zeto,  . . . , Pε -et, + ε-nal, és kiszámolunk egy sor ε-büntetés melletti megoldást Pε -et, Pε -ot, ε = 0.025, 0.050, . . . , 0.750-re. Így 30 megoldás párt kapunk, {S 0 , S ε }, {S 0 , S ε }, . . . , {S 0 , S ε }-at,

azokat 1

1

1

2

2

30

30

ezeket tudjuk összehasonlítani.  Az élek w(e) súlya a késedelem nélküli, átlagos utazási idot  jelöli, vagyis azt a minimális idot, amire forgalmi dugó nélkül az adott útszakaszon szükség van. Az élre vonatkozó w(e) ˆ tényleges utazási  ettol  a következoképpen  ido térhet el:

   λc (e) · w(e) ˆ =   egymástól függetlenül minden élre. Itt a

, , − p valószínuséggel 

w(e):

p valószínuséggel 

w(e):

1

λc (e) számok egymástól független véletlen számok, amelyek ≤ p ≤ 1 paramétert hiba valószínuségnek,  a

egyenletesen oszlanak el az [1, c] intervallumban. A 0 c

≥ 1 paramétert pedig hiba szélességnek nevezzük. Minden {S 0 , S ε } párra kiszámoljuk a w(S ˆ ˆ 0 ) és w(S ε ) függvények minimumát. Azért, hogy jobi

i

   ban érzékeljük annak elonyét, hogy két választási lehetoségünk van egy helyett, képezzük az elobbi értéknek az S 0 optimális megoldás értékével vett hányadosát.

φε = i

min{w(S ˆ ˆ 0 ), w(S εi )} w(S ˆ 0)

(i

= 1, . . . , 30).

φε értékeket 100,000 véletlenszeruen  generált 25 × 25-ös rácsos gráfra, ahol a hiba = 0.1 volt, a hibaszélesség pedig c = 8. A 14.3. ábrán a φε átlagos értékeit láthatjuk ε1 = 0.025, ε2 = 0.050, . . . , ε30 = 0.750-re.  unimodális ε-ra nézve. Amint az a 14.3. ábrán is látható, a megoldás párok φε várható minosége ∗   ε-ra. Ebben a példában ε ≈ 0.175 Ez azt jelenti, hogy φε eloször csökken, majd növekszik növekvo Kiszámoltuk a

i

valószínuség  p

 paraméter. az optimális bünteto

i

593

14.2. Több lehetséges megoldás eloállítása 

100

98

96 % 94

92

0.75

0.70

0.65

0.60

0.55

0.50

0.45

0.40

0.35

0.30

0.25

0.20

0.15

0.10

0.05

90

ε 14.3. ábra.

φεi

értékei

ε1 = 0.025, ε2 = 0.050, . . . , ε30 = 0.750-re 25 × 25-ös rácson.

∗ További kísérletek azt is kimutatták, hogy az optimális paraméter ε a probléma méretének nö∗ ∗ vekedésével csökken. (Például ε ≈ 0.6 volt 5 × 5-ös rácsokra, ε ≈ 0.175 25 × 25-ös rácsokra, és ε∗ ≈ 0.065 100 × 100-as rács gráfokra.)

A büntetéses megoldások monotonitási tulajdonságai Függetlenül attól, hogy egyszerre az összes

ε-büntetés

melletti megoldást generáljuk-e,

 strukturális tulajdonságok bizonyíthatók: vagy csak egyetlen egyet, a következo Az

ε

 tényezo  fokozatos növekedésével olyan Bε megoldásokat kapunk, amebünteto

lyekre



 része monoton módon egyre jobban illeszkedik (a megoldás a célfüggvény p bünteto egyre kevesebb büntetett részt tartalmaz),



az eredeti w célfüggvény monoton módon egyre rosszabbá válik, ami kompenzálja a  részben bekövetkezo  javulást. bünteto  tétel mondja ki pontosan. A fenti állításokat a következo

14.3. tétel. Legyen w : E

→R

egy valós értéku  függvény, p : E

→ R+

pedig egy pozitív

 deniálva minden valós értéku  függvény az E-n. Legyen Bε a 14.2. deníciónak megfeleloen

ε ∈ R+ -ra. Ekkor a következo négy állítás igaz. 1.

p(Bε ) gyengén monoton csökkeno 

2.

w(Bε ) gyengén monoton növekvo 

3.

A w(Bε )

4.

w(Bε )

ε-ra nézve.

ε-ra nézve.

− p(Bε ) különbség gyengén monoton növekvo ε-ra nézve.

+ ε · p(Bε ) gyengén monoton növekvo ε-ra nézve.

Bizonyítás. Legyen

 δ és ε két tetszoleges nem negatív valós szám, amelyekre 0 ≤ δ < ε.

594

14. Ember-gép kölcsönhatás

 egyenlotlenségek  Bδ és Bε deníciójából adódóan a következo teljesülnek.

1.

ε < ∞ esetén w(Bε ) + ε · p(Bε ) ≤ w(Bδ ) + ε · p(Bδ ) , w(Bε ) + δ · p(Bε ) ≥ w(Bδ ) + δ · p(Bδ ) .

(14.1) (14.2)

 a következot  kapjuk: (14.2)-t kivonva (14.1)-bol (ε − δ) · p(Bε ) ≤ (ε − δ) · p(Bδ ) | : (ε − δ) > 0 ⇔ p(Bε ) ≤ p(Bδ ) .  ε = ∞ esetén (14.3) ) egyenlotlenség közvetlenül következik a B∞  megszorozva 2. Vonjuk ki (14.3)-at (14.2)-bol w(Bε )

(14.3) deníciójából.

 kapjuk: δ-val, ekkor a következot

≥ w(Bδ ) .

(14.4)

 ekkor a következot  kapjuk: 3. Vonjuk ki (14.3)-at (14.4)-bol, w(Bε )

− p(Bε ) ≥ w(Bδ ) − p(Bδ ) .

 az 4. (14.2)-bol w(Bδ )



 ε > δ ≥ 0 egyenlotlenség felhasználásával a + δ · p(Bδ ) ≤ w(Bε ) + δ · p(Bε ) ≤ w(Bε ) + ε · p(Bε ) w(Bε ) + ε · p(Bε ) ≥ w(Bδ ) + δ · p(Bδ )

(14.5)

 egyenlotlenséget kapjuk.

Több alternatív megoldás létrehozása ugyanarra az

ε bünteto paraméterre

Ha adva van egy S 0 megoldás és további alternatív megoldásokra van szükségünk, akkor  módszert többször egymás után, különbözo  alkalmazhatjuk a bünteto

ε1 < · · · < εm

para-

méterekkel büntetve az S 0 -t. Az így kapott megoldások rendre S ε1 , S ε2 , . . . , S εm . Ennek a módszernek az a nagy hátránya, hogy csak az eredeti S 0 megoldásnak és az egyes alternatív megoldásoknak a közös részére van hatása az

εi

 alternatív értékeknek, de két különbözo

megoldás közös részére nincsen hatása. Ezért az S εi és S ε j nagyon hasonló is lehet külön i-re és j-re (i bözo

6,

j).

 módszert iteratívan alkalmazzuk ugyanarra az Ezt elkerülhetjük, ha a bünteto

ε-ra.

I´-  - (w, p, k, ε) ¨ ´ 1

oldjuk meg az eredeti min w(B) problémát és keressük meg az optimális S 0 megoldást

← ε · w(B ∩ S 0 ) bünteto függvényt + ε · p1 (B) problémát és keressük meg az S 1

2

deniáljuk a p1 (B)

3

oldjuk meg a módosított min w(B)

4

for j

5 6

← 2 to k do p j (B) ← ε · w(B ∩ S 0 ) + ε · w(B ∩ S 1 ) + · · · + ε · w(B ∩ S j−1 ) oldjuk meg a módosított min w(B) + ε · p j (B) problémát és keressük meg az S

7

j

megoldást

return (S 0 , S 1 , . . . , S k )

 változattal is helyettesíthetjük: Az 5. lépést a következo

megoldást

595

14.2. Több lehetséges megoldás eloállítása 

5



do p j (B)

← ε · w(B ∩ (S 0 ∪ S 1 ∪ · · · ∪ S j−1 ))

 esetben (5) a j számú S 0 , S 1 , . . . S j−1 megoldás közül r-hez tartozó megoldásAz elso



 részt r ·ε tényezovel bünteti. A második esetben (5 ) az S 0 , S 1 , . . . or S j−1 megoldások közül legalább egyhez tartozó megoldásrészt egyszeres multiplicitással bünteti. A teljesítménybeli  lehet. A legrövidebb útvonal problémára azonban három különbség a két eset között jelentos (S 0 , S 1 és S 2 ) megoldás esetén az (5) változat valamivel jobb eredményt adott. 14.6. példa. Vegyük ismét a 14.2. ábrán látható G

=

(V, E) gráfot. Az

ε = 0.1

 paraméterre bünteto

 T -be vezeto  legrövidebb út PD , amelynek hossza vonatkozóan keressünk három megoldást. Az S -bol  csúcsokat érinti: S - A - C - D - F -T . Ha a PD éleinek hosszát megszorozzuk 1.123, és a következo  del, és megoldjuk a kapott legrövidebb út problémát, akkor a P B útvonalat kapjuk, amely a következo csúcsokon megy keresztül: S - A - B - F - T . Ha az (5) lépésben megadott módszert követjük, akkor az (A, C), (C, D), (D, F), (A, B) és (B, F)  tényezovel  élek hosszait kell 1.1 bünteto megszoroznunk. Az (S , A) és (F, T ) éleket 1.2-vel kell megszoroznunk (dupla büntetés). Az ily módon kapott optimális megoldás PH lesz, ami az S - G - H - T csúcsokon megy keresztül.

14.2.5. Lineáris programozás  büntet® módszer Jól ismert tény, hogy a legrövidebb útvonal probléma, hasonlóan sok más áramlási problémához, lineáris programozással is megoldható. A lineáris programozás segítségével al ternatív megoldások is létrehozhatók. Eloször az eredeti legrövidebb útvonal problémára mutatjuk be a lineáris programozást. A legrövidebb útvonal probléma lineáris programként megfogalmazva Vegyünk egy G

=

(V, E) irányított gráfot, és egy w : E

→ R+

függvényt, amelyik a gráf

minden éléhez egy hosszúságot rendel. Legyen s és t a gráf két megkülönböztetett pontja.  t-be? Melyik a legrövidebb egyszeru  útvonal s-bol Minden e

= (i,

j)



E élre bevezetünk egy xe változót. xe -nek 1 értéket kell kapnia ha

az e él része a legrövidebb útvonalnak, egyébként pedig 0-t. Jelöljük S (i) E}



 csúcsok halmazát, P(i) V -vel az i csúcsra rákövetkezo

= {j ∈

= { j ∈ V : (i, j) ∈ ∈ E} ⊆ V -

V : ( j, i)

 o  csúcsok halmazát. Az LPlegrövidebb-út lineáris program a vel pedig az i csúcsot megeloz  következoképpen X formalizálható: min

w(e)

· xe

e∈ E

X

feltéve, hogy

x(s, j)



j∈S (s)

X x( j, s)

=1

 feltétel az s kezdopontra  kimeno vonatkozóan,

j∈ P(s)

X

x(t, j)



j∈S (t)

X

x( j,t)

= −1

 feltétel a t végpontra vonatkozóan, bemeno

x( j,i)

=0

minden további i

j∈ P(t)

X

x(i, j) j∈S (i)



X

∈ V \{ s, t}pontra

j∈ P(i)

 pontokra Kirchhoff-feltételek a belso 0



xe

≤ 1 minden e ∈

E-re

.

596

14. Ember-gép kölcsönhatás

A 1 1

1.1 1 1.2

B

S

C

1 1

T

D  módszerhez. 14.4. ábra. Példa gráf az LP-bünteto

 és végpontra vonatkozó feltételek miatt s egy forrás, t pedig egy nyelo.  A A kezdo  Ezért kell, hogy legyen egy Kirchhoff-feltételek miatt nincs több forrás, sem pedig nyelo.  t-be vezeto  s-bol

kapcsolat”. ” Nem nyilvánvaló, hogy ez a kapcsolat egy egyszeru  út. Az xe változóknak lehetne nem

  áramegész értéke is, vagy körök is elofordulhatnának bárhol. Van azonban egy alapveto lástani tétel, amelyik azt mondja ki, hogy az LPlegrvidebb−t lineáris programnak van olyan optimális megoldása, amelyre minden xe

> 0 értéke egyenlo 1-el. Az

xe

= 1-nek megfelelo

 t-be. élek egy egyszeru  útvonalat adnak s-bol 14.7. példa. Vegyük a 14.4 ábrán látható gráfot. A legrövidebb útvonal problémához tartozó lineá ris programozási feladat most hat egyenloség feltételt tartalmaz (minden csomópontra egyet), és hét  egyenlotlenség párt (minden élre egy párt).

min(xS A feltéve, hogy xS A

Az optimális megoldásra xS B

+ xS B + xBC + xCT + xDT ) · 1 + xAC · 1.1 + xBD · 1.2 + xS B = 1,

xCT

+ xDT = 1 ,

xS A

− xAC = 0,

xS B

− xBC − xBD = 0 ,

xAC

+ xBC − xCT = 0,

x BD

− xDT = 0 ,

0



xS A , xS B , xAC , x BC , x BD , xCT , xDT

=

x BC

=

xCT

≤1.

= 1.

 t-be Egy lineáris programozási feladat, amelyik két alternatív útvonalat ad meg s-bol Az alábbiakban megadjuk annak a feladatnak a lineáris programozásbeli reprezentációját,  t-be. amelyik két alternatív útvonalat keres meg s-bol Minden e

=

(i, j)



E élre bevezetünk két változót, xe -t és ye -t. Ha az e él mindkét

útvonalnak része, akkor xe és ye is 1 értéket fog kapni. Ha az e él csak egy útvonalnak része, akkor xe értéke 1 lesz, ye értéke pedig 0. Egyébként mind xe , mind ye 0 értéket kap.

ε>

0

 paraméter, amellyel a mindkét útvonalban szereplo  éleket büntetjük. egy bünteto  A fentiek gyelembe vételével a következoképpen formalizálhatjuk az LP2-rövid-út lineáris programozási feladatot:

597

14.2. Több lehetséges megoldás eloállítása 

min f (x, y) :=

X

· xe + (1 + ε) · w(e) · ye

w(e) e∈ E

X feltéve, hogy

x(s, j)

+ y(s, j) −

j∈S (s)

X x( j, s)

+ y( j, s) = 2

 feltétel az s kezdopontra vonatkozóan

j∈ P(s)

X

x(t, j)

+ y(t, j) −

j∈S (t)

X

x( j,t)

+ y( j,t) = −2

feltétel a t végpontra vonatkozóan

x( j,i)

+ y( j,i) = 0

Kirchhoff-feltételek

j∈ P(t)

X

x(i, j)

+ y(i, j) −

j∈S (i)

X

j∈ P(i)

minden további pontra i

0



xe , ye

≤ 1 minden e ∈

E-re

∈ V \{ s, t}

.

 gráfot. A két alternatív útvonal problémához tar14.8. példa. Tekintsük ismét a 14.4. ábrán szereplo  tozó lineáris programozási feladat most hat egyenloség feltételt tartalmaz (minden csúcspontra egyet), és 2

 · 7 = 14 egyenlotlenség párt.

min

(xS A

+



(yS A

feltéve, hogy xS A

+ xS B + xBC + xCT + xDT ) · 1 + xAC · 1.1 + xBD · 1.2  + yS B + yBC + yCT + yDT ) · 1 + yAC · 1.1 + yBD · 1.2 · (1 + ε) + yS A + xS B + yS B = 2 ,

xCT

+ yCT + xDT + yDT = 2 ,

xS A

+ yS A − xAC − yAC = 0,

xS B

+ yS B − xBC − yBC − xBD − yBD = 0 ,

xAC

+ yAC + xBC + yBC − xCT − yCT = 0,

x BD

+ yBD − xDT − yDT = 0 ,

0



xS A , xS B , xAC , x BC , x BD , xCT , xDT , yS A , yS B , yAC , y BC , y BD , yCT , yDT

≤1.

A lineáris programozási feladatot úgy értelmezhetjük, mint egy minimális költségu  áramlási problémát. De hol van vajon a kapcsolat a lineáris programozási feladat, és a között  t-be? a probléma között, hogy keresnünk kell két útvonalat s-bol 14.4. tétel. Ha az LP2-rövid-út lineáris programozási feladatnak van optimális megoldása, akkor van olyan (x, y) optimális megoldása is, amelyik a következo  tulajdonságokkal rendelkezik. Léteznek olyan E 1 , E 2 , E 3



E diszjunkt halmazok, amelyekre

∩ E2 = ∅, E1 ∩ E3 = ∅ és E2 ∩ E3 = ∅, (ii) xe = 1, ye = 0 minden e ∈ E 1 ∪ E 2 , (iii) xe = 1, ye = 1 minden e ∈ E 3 , (iv) xe = 0, ye = 0 minden e < E 1 ∪ E 2 ∪ E 3 . (v) E 1 ∪ E 3 egy P1 s-bol  t-be vezeto  utat reprezentál, E 2 ∪ E 3 egy P2 (i)

E1

s-bol  t-be vezeto  utat

ábrázol. E 3 pedig azon élek halmaza, amelyek mindkét útvonalban szerepelnek.

598

14. Ember-gép kölcsönhatás

S

a

c

e

g

b

d

f

h

T

14.5. ábra. Példa két útvonal nem egyértelmu  dekompozíciójára.

(vi) Nem létezik olyan (Q1 , Q2 ) ) útvonal pár, amelyik jobb lenne (P1 , P2 )-nél, azaz

w(P1 )

+ w(P2 ) + ε · w(P1 ∩ P2 ) ≤w(Q1 ) + w(Q2 ) + ε · w(Q1 ∩ Q2 ), minden (Q1 , Q2 ) párra.

Ez éppen azt jelenti, hogy a P1 és P2 -beli élhosszak összege plusz a kétszer használt élekre vonatkozó büntetés minimális.

A fentiekhez még az alábbi megjegyzéseket fuzhetjük. 



Minden élhez két változó tartozik, xe és ye . Ezt értelmezhetjük úgy is, mint egy olyan utcát, amelyiken van egy normális sáv, és egy további extra sáv. Az extra sáv használata drágább, mint a normális sávé. Ha egy megoldás egy élt csak egyszer használ, akkor az olcsóbb, normális sávot használja. Ha azonban a megoldás kétszer használja az élt, akkor a normális sávot és az extra sávot is használja.



 csúcspontból a végso  csúcspontba vezeto  útvonalának a Az (x, y) megoldásnak a kezdo  T -be két útvonal párt felbontása a legtöbb esetben nem egyértelmu.  A 14.5. ábrán S -bol  is eloállíthatunk, (a − c − e − g, b − d − f

− h)-t és (a − c − f − h,

b − d − e − g)-t. Mindkét

pár egyformán optimális a 14.4. tétel értelmében. Így a felhasználónak kell választania közülük más, további szempontok alapján.



 módszer és az LP-bünteto  módszer általában különbözo  megoldásokhoz veA bünteto  módszer kiszámolja az egyetlen legjobb megoldást, és egy megfelelo  zet. A bünteto  módszer két jónak mondható megoldást számol ki, amealternatívát. Az LP-bünteto lyek között kicsi az átfedés. A 14.4. ábrán láthatjuk, hogy ez a pár nem feltétlenül  T -be vezeto  legrövidebb útvonal tartalmazza a legjobb megoldást. Az ábrán az S -bol

ε > 0.1-re az ε büntetés melletti megol= S –A–C–T . A (P1 , P2 ) útvonal pár összhossza 6.1, a közös szakaszok hossza  módszer a (P2 , P3 ) = (S –A–C–T , S –B–D–T ) 1.0. ε > 0.2-re azonban az LP-bünteto  amelyek össz hossza 6.3, a közös szakaszaik hossza pedig 0. útvonalakat állítja elo, P1

=

S –B–C–T , amelynek hossza 3. Minden

dás P2



Lehetséges lenne k darab megoldásjelölt útvonal megkeresése is valamely k k −1

bevezetünk k darab xe , xe , . . . , xe 0

1

>

2-re, ha

változót minden e élre, és beállítjuk s kínálatát és t

599

14.2. Több lehetséges megoldás eloállítása 

 keresletét k-ra. Célfüggvényként használhatjuk például a következot:

min f (x

0

, . . . , xk−1 ) :=

k−1 XX

e∈ E

(1

+ j · ε) · w(e) · xej

(1

+ ε) j · w(e) · xej .

j= 0

vagy min f (x

0

, . . . , xk−1 ) :=

k−1 XX

e∈ E



j= 0

 módszer nem csak a legrövidebb útvonal problémára muködik. Az LP bünteto  Általánosíthatjuk azt bármilyen, lineáris programozással megoldható problémára.



Egy hasonló módszert, az egész értéku  lineáris programozásos bünteto  módszert alkalmazhatunk egész értéku  lineáris programozási feladatokra.

14.2.6. Büntet® módszer heurisztikák alkalmazásával  módszernek egzakt algoritmusokkal együtt való alkalmazáA 14.2.2. pontban a bünteto sát tárgyaltuk. Ilyen volt például a Dijkstra-algoritmus, vagy a dinamikus programozás a  módszert azonban (egzakt megoldások helyett) legrövidebb útvonal problémára. A bünteto heurisztikák esetén is alkalmazhatjuk több megoldás jelölt megkeresésére.  cserével 14.9. példa. Egy jól ismert heurisztika az utazóügynök problémára a lokális keresés kettos (lásd a 14.2.1. pontot). B ´ --´ -  - ¨ ¨ ¨ - ´  ´  - ´  1

 csere heurisztikát a büntetés nélküli problémára, alkalmazzuk a kettos

2

büntessük meg a T -hez tartozó éleket úgy, hogy megszorozzuk a hosszukat (1

3

 csere heurisztikát a büntetés melletti problémára, alkalmazzuk a kettos

4

számoljuk ki a T ε módosítás nélküli hosszát

5

return (T , T ε )

az így kapott lokálisan optimális megoldás (ami nem feltétlenül globálisan optimális) legyen T

+ ε)-nal

az így kapott alternatív megoldás legyen T ε

Kérdés: Milyen

ε≥

0 paramétert használjunk, hogy a leggyorsabb útvonal utazási idejét mini-

malizálni tudjuk? A 14.5. példában már ismertetetthez hasonló kísérletet végeztek el az utazóügynök problémára 25 véletlenül kiválasztott ponttal az egységnégyzetben. A 14.6. ábra az arányosított átlagokat mutatja

ε0 = 0.000, ε1 = 0.025, . . . , ε30 = 0.750 értékekre.   A megoldás párok φε várható minosége (most is) unimodális az ε büntetési tényezore nézve. Ez ∗   ε-ra. Ebben a példában ε ≈ 0.175 az azt jelenti, hogy φε eloször csökken, majd növekszik növekvo

az

 paraméter. optimális bünteto További kísérletek azt is kimutatták, hogy az

ε∗ optimális paraméter a probléma méretének növe-

kedésével csökken.

Gyakorlatok  utazóügynök problémára vonatkozó programozási gyakorlat segít ab14.2-1. A következo, ban, hogy jobban átérezzük a lokális optimumok nagy változatosságát. Generáljunk vélet-

600

14. Ember-gép kölcsönhatás

102

101

% 100

99

0.75

0.70

0.65

0.60

0.55

0.50

0.45

0.40

0.35

0.30

0.25

0.20

0.15

0.10

0.05

98

ε 14.6. ábra.

φεi

az

ε0 = 0, ε1 = 0.025, . . . , ε30 = 0.750 értékekre 25 × 25-ös rácson.

lenszeruen  200 pontot a 2-dimenziós egységnégyzetben. Számoljuk ki a távolságokat az  cserével, véletEuklideszi metrika szerint. Futtassuk le százszor a lokális keresést kettos  útvonalból kiindulva. Számoljuk meg, hogy hány különbözo  lokális lenül választott kezdo minimumot találtunk.  internetes keresomotoroknak.  14.2-2. Adjuk meg ugyanazokat a kulcsszavakat különbözo Hasonlítsuk össze a találati listákat, és azok változatosságát. 14.2-3. Formalizáljuk az utazóügynök problémát egy

P

-típusú problémaként.

14.2-4. Bizonyítsuk be a 589. oldalon található megjegyzésben foglalt állítást.  függvény additív büntetés esetén, mint például a 14.2. 14.2-5. Hogyan néz ki a p(e) bünteto példában?  (1) és (2) tulajdonságokat. 14.2-6. Bizonyítsuk be a 591. oldalon levo 14.2-7. Alkalmazzuk az

  ´    algoritmust a 14.2 ábrán látható legrövidebb

 útvonal problémára S kezdoponttal és T végponttal. Legyen w(e) az él hossza minden e-re, p(e) pedig legyen azokra az élekre, amelyek hozzátartoznak PD -hez (S - A - C - D - F - T útvonal) az él hossza, a többi élre pedig p(e)

= 0. Vagyis egy útvonalra vonatkozó büntetés

 lesz azon szakaszainak hosszával, amelyek közösek PD -vel. értéke egyenlo

ε > 0 bünteto paramétert a 595. oldalon levo 14.6. példában, hogy = 3-ra az ott leírt elso módszer (a pszeudokód 5. sora) három különbözo útvonalat hozzon

14.2-8. Keressünk olyan k



 létre, a második módszer (a pszeudokód 5 sora) viszont csak kettot.

14.3. További interaktív problémamegoldó algoritmusok Van néhány további terület, ahol egy embernek kell a számítógép által generált megoldásjelöltek közül választania. Ebben a szakaszban négy fontos esetet mutatunk be ezek közül,  vegyes témákkal zárjuk e fejezetet. majd különbözo

601

14.3. További interaktív problémamegoldó algoritmusok

14.3.1. Tetsz®leges futási idej¶ algoritmusok  Egy ilyen tetszoleges futási ideju  algoritmusban a számítógép elkezd dolgozni egy prob pillanattól kezdve folyamatosan jelennek meg a megoldásjelöltek lémán, és szinte az elso  (mindig az addig talált legjobbak) a képernyon. Természetesen egy ilyen folyamat során a   megoldások, amelyeknek az optimakezdeti outputok gyakran csak elozetes, vagy közelíto litása nem garantált, és ezek még messze vannak a tökéletes megoldástól. Nézzünk egy példát. Az iteratív mélyítés többszörös, mélységében korlátozott keresést végez, és minden lépésben fokozatosan növeli a keresés mélységi korlátját. Tegyük fel, hogy a feladatunk jó megoldások keresése egy nagyméretu  T

R

=

(V, E) fában. Legyen f : V



a maximalizálandó függvény, Vd pedig a fa azon csúcspontjainak halmaza, amelyek d

 távolságra vannak a gyökértol. F´ -´ -´ -´-´ ´´ (T , f )

← ←1

1

Opt

2

d

3

while d

4

f (root)

Opt ← Maxd

then Opt

7

d

←d+1

 Minden idopillanatban az éppen aktuális legjobb megoldás (Opt) jelenik meg a monitoron. Az operátor bármelyik pillanatban megállíthatja a folyamatot. Az iteratív mélyítés nem csak a számítógép és ember kölcsönhatásával foglalkozó terület számára érdekes, hanem van számos alkalmazása a teljesen automatizált számításokban  játékok fájában való keresés. A versenysakkban a programnak is. Jó példa erre a különbözo  áll rendelkezésére 40 lépés megtételére. Itt az iteratív mélyítés kulcsfontosságú rögzített ido  eszköz abban, hogy megtaláljuk az egyensúlyt az idofelhasználás és az alfa-béta keresés között.  Egy másik gyakori példa tetszoleges futási ideju  algoritmusokra egy heurisztika ismételt alkalmazása. Legyen f

: A

→ R

valamilyen bonyolult függvény, és keressük a

 elemeket. Legyen H egy valószínuség nagy függvényértékkel rendelkezo  alapú heurisztika, amely egy megoldásjelöltet ad meg erre az (A, f ) maximalizálási problémára. H lehet például valamilyen lokális keresés, vagy más gradiens módszeren alapuló eljárás. H-t alkalmazhatjuk újra és újra, egymástól független menetekben, és mindig az eddig talált legjobb megoldást kínáljuk fel kimenetként.  A tetszoleges futási ideju  algoritmusok harmadik alkalmazási területe a Monte Carlo  szimulációk, például a Monte Carlo integráció. Egy statikus megközelítés elore meghatározott számú (pl. 1000) véletlen pont alapján muködne,  és ezek alapján adná meg az átlagot az outputban. Azonban már a menet közbeni átlag értékek (1, 2, 3 pont után, vagy minden  10-es, 50-es blokk után) adhatnának elorejelzést arra vonatkozóan, hogy melyik régióban  eredmény, illetve, hogy van-e értelme az összes lépés végrehajtásának. A várható a végso varianciáknak és a kilógó értékek gyakoriságának a megjelenítése további információt szolgáltat arra vonatkozóan, hogy mikor a leginkább érdemes megállítani a Monte Carlo eljárás futását.

602

14. Ember-gép kölcsönhatás

 rendszerekben a tetszoleges  Az ember és számítógép együttmuködését  feltételezo fu tási ideju  algoritmusok még egy további elonnyel rendelkeznek, mégpedig azzal, hogy a  számítások ideje alatt az ember már értékelheti és összehasonlíthatja az elozetes megoldásjelölteket.

14.3.2. Interaktív evolúció és generatív tervezés  algoritmusok, amelyek a természetes kiválasztóA genetikus algoritmusok olyan kereso dáson és a természetes genetikán alapulnak. Egyetlen megoldás helyett megoldások egész populációjával foglalkoznak. A genetikus algoritmusokat gyakran alkalmazzák olyan nagy  és bonyolult problémákra, amelyeknél a hagyományos optimalizálás csodöt mond. Az interaktív evolúció olyan evolúciós algoritmus, amely emberi közremuködést  igényel. Az interaktív evolúció során a felhasználó választ ki egy vagy több egyedet az aktuális populációból, amelyek túlélve és önmagukat (mutációval) reprodukálva az új generációt fogják alkotni. Így az interaktív evolúcióban a felhasználó játssza a célfüggvény szerepét,   folyamatban. és ezért meglehetosen aktív szerepe van a kereso Az olyan területeken mint a muvészet,  építészet, fényképfeldolgozás (beleértve a fantomképek tervezését), az interaktív evolúciónak egy speciális formáját, az úgynevezett generatív tervezést használják. A generatív tervezés során az aktuális generáció összes meg oldását egyidejuleg  láthatjuk a képernyon. Itt az összes” alatt általában egy 4 és 20 közötti ” számra kell gondolni. Gondoljunk a fényképfeldolgozás példára, ahol a felhasználó kivá laszthatja a módosított kontrasztot, fényerot, szín intenzitást és élességet. A felhasználó megvizsgálja az aktuális jelölteket, és egyetlen egérkattintással bejelöli azt, amelyik a legjobban tetszik neki. Az összes többi megoldás törölve lesz, és a megjelöltnek N darab újabb mutánsa generálódik. A folyamat addig folytatható amíg a felhasználó meg lesz elégedve az eredménnyel. A generatív tervezésben járatlan ember számára talán hihetetlenül hang zik, de gyakran még egy gyenge minoség u  kiinduló megoldásból is néhány iteráció alatt elfogadható eredmények születnek.

14.3.3. Egymást követ® rögzítések Számos probléma sokdimenziós, és így sok paraméter beállítását igényli. Ha egy ilyen prob heurisztikák ismételt alkalmazáléma esetén jó megoldásoknak egy halmazát állítjuk elo  többlépéses, interaktív folyamatot használhatjuk. Eloször  sával, akkor a következo néhány  ember megvizsgál. A szakérto  elso heurisztikus megoldást generálunk, amiket egy szakérto sorban

tipikus” mintákat keres a megoldásokban és rögzíti ezeket. Ezután további heurisz” tikus megoldásokat generálunk azzal a mellékfeltétellel, hogy valamennyien tartalmazzák a  ismét megvizsgálja a megoldásokat, és újabb részekorábban rögzített részeket. A szakérto

ket rögzít. A folyamat addig folytatódik, amíg minden rész rögzített lesz, és így egyetlen (és  remélhetoleg jó) megoldást kapunk.

14.3.4. Interaktív több feltételes döntéshozatal  vagy több célfüggvényünk A több feltételes döntéshozatal esetén nem egy, hanem ketto van. A feladat olyan elfogadható megoldások keresése, amelyek az összes célfüggvényt  legjobbak. Általában a célfüggvények többé-kevésbé ellentmondagyelembe véve a leheto nak egymásnak, és így kizárják az egyértelmu  optimum létezését. Hasznos lehet ilyenkor a

14.3. További interaktív problémamegoldó algoritmusok

603

 hatékony megoldás” fogalma, amit a következoképpen deniálhatunk: egy hatékony meg” oldás esetén nem létezik olyan másik megoldás, amelyik legalább egy célfüggvény szempontjából jobb nála, az összes többi szempontjából pedig nem rosszabb.  lépés lenni, hogy kiszámoljuk a A több feltételes döntéshozatalnál az szokott az elso hatékony megoldásokat. A két feltételes esetben a

hatékony” határt vizuálisan is megje” leníthetjük egy kétdimenziós diagramon, ami az emberi döntéshozónak jó áttekintést ad a   lehetoségekr ol.

14.3.5. Különböz® további témák •

 hogy a száSzámítógépes megoldások grakus megjelenítése. Az még nem elegendo,  megoldásjelölteket generál, az eredményeket megfelelo  módon meg mítógép megfelelo is kell jeleníteni. Egyetlen megoldás esetén a fontos részeket és tulajdonságokat kell  megoldás esetén a különbségeket és a speciakiemelni, míg több, egymással versengo litásokat kell hangsúlyozni.



Folyamatos számítógépes futás rövid emberi közbeavatkozásokkal. Ezt a módszert szo hasonlat miatt. Az ember minden nap 1 + 23 óra mód”-nak is nevezni a következo ”   alatt megnézi az elmúlt 23 órában a számí1 órát ül a számítógép elott. Ez alatt az ido kás

  interakciókat végez a géppel, valamint tógép által eloállított eredményeket, különbözo  23 órában. Így az ember az idejének megmondja neki, hogy mit csináljon a következo csak egy kis részét fekteti be a munkába, a gép viszont folyamatosan fut. Egy jó példa a fentiekre a levelezési sakk, ahol a számítógép segítségének igénybevétele  játékosok legtöbbje egy vagy több számítógépet hivatalosan is megengedett. A vezeto futtat egész nap, amelyek a kritikus állásokat és folytatásokat elemzik. A sakkozók  töltenek az csupán összegyujtik  ezeket az eredményeket, és naponta csak egy rövid idot elemzésükkel.



Váratlan hibák és numerikus instabilitások.

Minden programban van hiba!” ezt az ” alapszabályt gyakran elfelejtik. Az emberek túlságosan gyakran minden kritika nélkül elhiszik, amit a monitoron látnak, vagy amit a szoftvertermék leírásában olvas  nak. Mégis meglepoen gyakran elofordul, hogy ugyanarra a feladatra (aminek egyetlen  eredményeket optimális megoldása van) több független programot futtatva különbözo  progkapunk. A numerikus stabilitás sincs ingyen. Ugyanarra a problémára különbözo  eredményt adhatnak a kerekítési hibák miatt. Ezeket a hibalehetosé ramok különbözo geket úgy fedezhetjük fel, ha egymástól független programokat futtatunk.  Természetesen a hardverben is lehetnek hibák, foleg a folyamatos miniatürizálás korában. Ezért kritikus helyzetekben az lehet a jó stratégia, ha ugyanazt a programot teljesen  független gépeken futtatjuk le, lehetoleg egymástól független operátor személyzet segítségével.

Gyakorlatok

14.3-1. Tekintsük az utazóügynök problémát 200 véletlenszeru  (xi , yi ) ponttal a [0, 1]×[0, 1] egységnégyzetben, az Euklideszi távolsággal. Generáljunk 100 lokálisan optimális megol cserével, lásd a 14.2.1. pontban) és számoljuk össze, hogy melyik él hányszor dást (a kettos  ebben a száz megoldásban. Deniáljunk egy K küszöböt (például K fordul elo

= 30) és rög-

604

14. Ember-gép kölcsönhatás

 zítsük azokat az éleket, amelyek legalább K megoldásban elofordulnak. Generáljunk újabb 100 megoldást, úgy, hogy a rögzített élek cseréjét ne engedjük meg. Ezt ismételjük addig,  sorozatok amíg a folyamat nem konvergál, majd hasonlítsuk össze a végeredményt az elso  lokális optimumaival. jellemzo

Megjegyzések a fejezethez Az

ember-gép kapcsolat” bevezetésben idézett deníciójának forrása a HCI Bibliog” ” raphy” [366]. Sameith [409] technikai jelentésében számos kísérletet, leírást és elemzést találunk a  módszerre, különbözo  összeg típusú problémák, dimenziók és hibaszélességek esebünteto  tére. A 14.3. tétel bizonyítása eloször [14]-ben jelent meg. Az e-kereskedelemben a több  választási lehetoséget kínáló rendszereket gyakran

Tanácsadó rendszerek”-nek nevezik – ”  tartva a vevoket,  mint például Resnick és Varian cikkében [384] – szem elott akik számára   termékeket ki kell listázni. Értheto  okokból a kereskedelmi kereso  motorok az oket érdeklo és az e-cégek titokban tartják a kivonatoló algoritmusaikat. A 14.2.5. pontban említett áramlástani tétel megtalálható Ahuja, Magnanti és Orlin könyvében [7].  programot forgalmaz az AND cég [514]. Muholdas Egy útvonaltervezo  felvételeken alapuló útvonaltervezéssel foglalkozik Berger [44] diplomamunkája. A BigBlackCell nevu  szoftver Grosse és Schwarz munkája [178].  jó tankönyvnek. Az A genetikus algoritmusokról például Goldberg [156] tekintheto interaktív evolúciót és a generatív tervezést Banzhaf [30] tárgyalja. A több feltételes döntéshozatallal több cikk is részletesen foglalkozik, az egyik alapmu  Gal, Stewart és Hanne könyve [145].  és a versenysakkban elért sikereiAlthöfer könyvében [11] a 3-agy történeti hátterérol  olvashatunk. A 3-agy és Juszupov nagymester közötti mérkozésr   [12] számol be. [13] rol ol  amikor több számítógép javaslatát használva javítáltalános tájékoztatást ad arról az esetrol,  [15] néhány k-legjobb megvalósítást mutat be játékok fájában való keresésre juk a játékerot.   web címen tekintiteratív mélyítéssel. Ezen megvalósítások képernyomentéseit a következo hetjük meg: http://www.minet.uni-jena.de/www/fakultaet/iam/personen/k-best.html. [200] a sakkprogramok és más bonyolultabb játékok technikai hátterét mutatja be. M. Zuker és D. H. Turner által írt programok értékes on-line gyujteménye  található a http://www.bioinfo.rpi.edu/applications/mfold címen. A felhasználó bevihet például RNS  láncokat, és a rendszer valós idoben eloállítja ezen láncok lehetséges másodlagos térszerkezetét. Többek között olyan paraméterek adhatók meg, mint a száma” (alapértelmezés téke” (alapértelmezés

=

50), vagy például az optimálistól való

= 5 %).

 kiszámított gyur  odések ” százalékos eltérés mér”

 A genetikai algoritmusokkal magyarul foglalkozik Álmos Attila, Gyori Sándor, Horváth Gábor és Várkonyiné Kóczy Annamária könyve [293], a kapcsolódó biológiai fogalmak megismeréséhez pedig Podani János könyvét [374] ajánljuk.

15. Számítógépes grafika

A számítógépes graka egy virtuális világot épít fel a memória adatszerkezeteiben, amit egy virtuális kamerával fényképez le. A virtuális világ alakzatokat (pontokat, szakaszokat, felületeket, testeket stb.) tartalmaz, amit az algoritmikus feldolgozáshoz számokkal írunk le. A képszintézis a virtuális világ és a kamera tulajdonságai alapján számítja ki a képet. A  kép feltételezésünk szerint azonos méretu  kicsiny téglalapokból, úgynevezett képelemekbol,  így elegendo  a képszintézist pixepixelekbol  áll. Egy képelemhez egyetlen szín rendelheto, lenként egyetlen pontban, például a középpontban végrehajtani. A fényképezés megkeresi a ponton keresztül látható alakzatot, és annak színét írja a kép pixelébe. Ebben a könyvben csak a látható alakzatok meghatározásával foglalkozunk, az alakzatok színét ismertnek tételezzük fel.  fejezetekben eloször  A következo áttekintjük, hogyan írhatjuk le az alakzatokat számokkal, majd megismerkedünk a fényképezési folyamat algoritmusaival.

15.1. Analitikus geometriai alapok Vizsgálatunk alaphalmaza általában az euklideszi tér. A számítógépes algoritmusokban a tér elemeit számokkal kell leírni. A geometria számokkal dolgozó ága az analitikus geometria,  eszköze a vektor és a koordinátarendszer. melynek alapveto 15.1. deníció. A vektor egy irányított szakasz, vagy másképpen egy eltolás, aminek iránya és hossza van, és amely a tér egy pontjához azt a másik pontot rendeli hozzá, amelyik tole  a megadott irányban és a vektor hosszának megfelelo  távolságban van. A vektorokra a ~ v jelölést fogjuk alkalmazni. A vektor hosszát gyakran a vektor abszolút értékének is mondjuk és |~ v|-vel jelöljük. A vektorokon értelmezzük az összeadás muveletet,  amelynek eredménye egy újabb vektor, amely az összeadandó eltolások egymás utáni végrehajtását jelenti. A továbbiakban az összeadásra a~ v1

+ ~v2 = ~v jelölést alkalmazzuk. Beszélhetünk egy vektor és egy szám szorzatáról, amely = ~v), és ugyanabba az irányba tol el, mint a ~v1 szorzandó, de a megadott λ szám arányában kisebb vagy nagyobb távolságra.

ugyancsak vektor lesz (λ · ~ v1

 a két vektor hosszának és a bezárt Két vektor skaláris szorzata egy szám, amely egyenlo szögük koszinuszának a szorzatával:

~v1 · ~v2 = |~v1 | · |~v2 | · cos α,

ahol

α a ~v1

és ~ v2 vektorok által bezárt szög

.

606

15. Számítógépes graka

Két vektor meroleges,  ha skaláris szorzatuk zérus.  Másrészt, két vektor vektoriális szorzata egy vektor, amely meroleges a két vektor síkjára, a hossza pedig a két vektor hosszának és az általuk bezárt szög szinuszának a szorzata:

~v1 × ~v2 = ~v,

 ~v1 , ~v2 -re, és |~v| ahol ~ v meroleges

= |~v1 | · |~v2 | · sin α .

 A két lehetséges meroleges közül azt az irányt tekintjük a vektoriális szorzat irányának,  ujja mutatna, ha a hüvelykujjunkat az elso  vektor irányába, a amerre a jobb kezünk középso mutatóujjunkat pedig a második vektor irányába fordítanánk (jobbkéz szabály). Két vektor párhuzamos, ha vektoriális szorzatuk nulla.

15.1.1. A Descartes-koordinátarendszer  két, nem párhuzamos ~i, ~j vektor lineáris A sík bármely ~ v vektora egyértelmuen  kifejezheto kombinációjaként, azaz

~v = x · ~i + y · ~j

alakban. Hasonlóan a tér bármely ~ v vektora egyértelmuen  megadható három, nem egy síkba  vektor lineáris kombinációjaként: eso

~v = x · ~i + y · ~j + z · ~k . Az ~i, ~j, ~ k vektorokat bázisvektornak, az x, y, z skalárokat koordinátáknak nevezzük. A továbbiakban feltételezzük, hogy a bázisvektorok egységnyi hosszúak, és egymásra páron ként merolegesek. A bázisvektorok ismeretében bármely vektor egyértelmuen  megadható számokkal, mégpedig a koordinátáival. Egy pontot egy vektorral adunk meg úgy, hogy megmondjuk, hogy az a tér egy kitüntetett pontjához, az origóhoz képest milyen irányban és távolságra van. Ezt a vektort a pont helyvektorának nevezzük. Az origó és a bázisvektorok együttese a Descartes-koordinátarendszer, amellyel az  euklideszi sík, illetve a tér pontjai egyértelmuen  számszerusíthet  ok. A Descartes-koordinátarendszer az euklideszi geometria algebrai megalapozása, amin  azt értjük, hogy a Descartes-koordináta hármasok a tér pontjainak megfeleltethetok, és a geometriai, illetve algebrai fogalmak párba állítása után az euklideszi geometria axiómái (és így a tételei is) algebrai eszközökkel igazolhatók.

Gyakorlatok 15.1-1. Igazoljuk, hogy a Descartes-koordináták és a pontok egy-egyértelmu  kapcsolatban állnak. 15.1-2. Bizonyítsuk be, hogy ha a bázisvektorok egységnyi hosszúak és egymásra páron ként merolegesek, akkor (x1 , y1 , z1 )

· (x2 , y2 , z2 ) =

x1 x2

+ y1 y2 + z1 z2 .

15.1-3. Igazoljuk, hogy a skaláris szorzás az összeadásra nézve disztributív.

15.2. Ponthalmazok leírása egyenletekkel   megadására. Egy koorA koordinátarendszerek lehetoséget adtak pontok számokkal történo dinátákra megfogalmazott feltételrendszerrel pedig egy teljes ponthalmazt azonosíthatunk.

607

15.2. Ponthalmazok leírása egyenletekkel

f (x, y, z) implicit függvény

test R sugarú gömb

R

2a, 2b, 2c élu  téglatest

2

− x2 − y2 − z2

min{a

z tengelyu,  r (hurka) és R (lyuk) sugarú tórusz

− | x|, b − |y|, c − |z|} p 2 2 2 r − z − (R − x2 + y2 )

15.1. ábra. Néhány – origó középpontú – testet deniáló implicit függvény.

  koordinátaA feltételrendszer általában egyenlet vagy egyenlotlenség, amelyet kielégíto hármasokhoz tartozó pontokat mondjuk a ponthalmazhoz tartozónak.

15.2.1. Testek A test a háromdimenziós tér egy részhalmaza. A részhalmaz kijelöléséhez egy folytonos f függvényt hívunk segítségül, amely a tér pontjait a valós számokra képezi le, és azokat a  pontokat tekintjük a testhez tartozónak, amelyek kielégítik az alábbi implicit egyenlotlenséget: f (x, y, z) Az f (x, y, z)

>

≥0.

  pontok a test belso 0 egyenlotlenséget teljesíto  pontjai, az f (x, y, z)

<

0

  a külso  egyenlotlenséget kielégítok  pontok. Az f függvény folytonossága miatt a külso  pontokat, amelyek között” találjuk az f (x, y, z) = 0 egyenletet kielégíto ”  és belso  pontokra az f függvény a a test határfelületét alkotják. Szemléletesen a külso

 pontok és belso

 mért elojeles  határfelülettol távolságot jellemzi. Megjegyezzük, hogy szigorú értelemben nem tekintjük a tér pontjainak bármilyen részhalmazát testnek, csak azokat, amelyek nem tartalmaznak háromnál alacsonyabb dimenziós  kilógó görbéket, és felületeket), azaz megköveteljük, hogy elfajulásokat (például a testbol   pont is legyen. a határfelület minden pontjának tetszolegesen kicsiny környezetében belso  algoritmus gyelmen kívül Nem kell azonban betartanunk ezt a feltételt, ha a megjeleníto hagyja az elfajuló részeket. A 15.1. ábra bemutatja a gömböt, téglatestet és tóruszt deniáló implicit függvényt.

15.2.2. Felületek Az f (x, y, z)

=

 pontok a test határpontjai, amelyek egy felületet al0 egyenletet kielégíto

kotnak. A felületeket tehát leírhatjuk ezzel az implicit egyenlettel. Mivel a pontokat azok helyvektoraival is deniálhatjuk, az implicit egyenletet megfogalmazhatjuk magukra a helyvektorokra is: f (~ r)

=0.

Egy felületet sokféleképpen adhatunk meg egyenlettel, például az f (x, y, z)

= 0 helyett az = 0 és a 2 · f 3 (x, y, z) = 0 nyilván ugyanazon pontokat jelöli ki. ~n normálvektorú és ~r0 helyvektorú sík azon ~r pontokat tartalmazza, amelyekre

f (x, y, z) 2

Egy az ~ r

− ~r0

 vektor a sík normálvektorára meroleges, tehát skalárszorzatuk zérus, így a sík

pontjainak implicit vektor és skalár egyenlete: (~ r

− ~r0 ) · ~n = 0,

nx

· x + ny · y + nz · z + d = 0 ,

(15.1)

608

15. Számítógépes graka

x(u, v) · cos 2πu · sin πv R · cos 2πu R · (1 − v) · cos 2πu

test R sugarú gömb

y(u, v) · sin 2πu · sin πv R · sin 2πu R · (1 − v) · sin 2πu

R

R sugarú, z tengelyu,  h magasságú henger R sugarú, z tengelyu,  h magasságú kúp

15.2. ábra. Néhány – felületet deniáló – paraméteres forma, ahol u, v

ahol n x , ny , nz a normálvektor koordinátái és d

z(u, v)

R

R

· cos πv h·v h·v

∈ [0, 1].

= −~r0 ·~n. Amennyiben a normálvektor hossza

 egységnyi, a d a síknak az origótól vett elojeles távolsága. Két síkot párhuzamosnak nevezünk, ha normálvektoraik párhuzamosak.  Az implicit egyenlet helyett a másik lehetoség a paraméteres forma alkalmazása, amikor a felületnél két szabad paraméter alapján állítjuk be a koordinátákat. Például egy felület paraméteres egyenlete az u, v szabad paraméterekkel: x

=

x(u, v),

y

= y(u, v),

z

= z(u, v),

u

∈ [umin , umax ],

v

∈ [vmin , vmax ] .

 az implicit egyenletet úgy származtathatjuk, hogy a A felület paraméteres egyenleteibol  kiküszöböljük az u, v szabad paramétereket. három egyenletbol A 15.2. ábra bemutatja a gömböt, hengert és kúpot deniáló paraméteres formát. Az implicit egyenlethez hasonlóan, a paraméteres egyenleteket megfogalmazhatjuk magukra a helyvektorokra is:

~r = ~r(u, v) . A háromszög a ~ p1 , ~ p2 és ~ p3 pontok konvex-kombinációinak halmaza, azaz

~r(α, β, γ) = α · ~p1 + β · ~p2 + γ · ~p3 ,

ahol

α, β, γ ≥ 0

A szokásos, kétparaméteres egyenlethez úgy jutunk, hogy az pedig (1

és

α+β+γ =1 .

α-t

u-val, a

β-t

v-vel, a

γ-t

− u − v)-vel helyettesítjük: ~r(u, v) = u · ~p1 + v · ~p2 + (1 − u − v) · ~p3 ,

ahol u, v

≥0

és u

+v≤1 .

15.2.3. Görbék  felület Két felület metszeteként görbét kapunk, amelyet megadhatunk a két metszo f1 (x, y, z)

=

f2 (x, y, z)

=0

alakú implicit egyenleteivel is, de ez általában feleslegesen körülményes. Tekintsük inkább a két felület ~ r1 (u1 , v1 ), illetve ~ r2 (u2 , v2 ) paraméteres formáit. A metszet pontjai kielégítik az ~ r1 (u1 , v1 )

= ~r2 (u2 , v2 )

vektoregyenletet, amely a háromdimenziós térben három skalár-

 tehát hármat kiküegyenletnek felel meg. A négy ismeretlen (u1 , v1 , u2 , v2 ) paraméterbol szöbölhetünk, így a görbét az egyváltozós x

=

x(t),

y

= y(t),

z

= z(t),

t

függvényekkel, vagy az

~r = ~r(t), vektoriális alakkal írhatjuk le.

t

∈ [tmin , tmax ]

∈ [tmin , tmax ]

609

15.2. Ponthalmazok leírása egyenletekkel

test   ellipszis 2a, 2b fotengely u,  z síkon lévo R sugarú, z irányban h emelkedésu  csavarvonal (x1 , y1 , z1 ) és (x2 , y2 , z2 ) közötti szakasz

x(u, v) · cos 2πt R · cos 2πt x1 (1 − t) + x2 t a

y(u, v)

z(u, v)

· sin 2πt R · sin 2πt y1 (1 − t) + y2 t b

15.3. ábra. Néhány – görbét deniáló – paraméteres forma, ahol t

0

·t − t) + z2 t h

z1 (1

∈ [0, 1].

A 15.3. ábra bemutatja az ellipszist, csavarvonalat és szakaszt deniáló paraméteres formát. Figyeljük meg, hogy a felületeken úgy is felvehetünk görbéket, hogy az u, v szabad paraméterek közül az egyiket rögzítjük. Például a v paraméter rögzítésével kapott görbe paraméteres alakja ~ rv (u)

= ~r(u, v). Ezeket a görbéket izoparametrikus görbéknek nevezzük.

Az egyenes pontjai közül jelöljünk ki egyet, és a kijelölt pont helyvektorát nevezzük az  egyenes helyvektorának. Az egyenes egy tetszoleges pontját a kijelölt pont egy kitüntetett iránnyal párhuzamos eltolásával kaphatjuk meg. A helyvektort ~ r0 vektorral, a kitüntetett irányt pedig ~ v irányvektorral jelölve, az egyenes egyenlete:

~r(t) = r0 + ~v · t,

t

∈ (−∞, ∞) .

(15.2)

Két egyenest párhuzamosnak mondunk, ha irányvektoraik párhuzamosak. A teljes egyenes helyett egy szakasz pontjait is megadhatjuk, ha a t paramétert egy véges intervallumra korlátozzuk. Például az ~ r1 ,~ r2 pontok közötti szakasz egyenlete:

~r(t) = ~r1 + (~r2 − ~r1 ) · t = ~r1 · (1 − t) + ~r2 · t,

t

∈ [0, 1] .

(15.3)

Ezen deníció szerint a szakasz pontjai a végpontjainak konvex-kombinációi.

15.2.4. Normálvektorok A számítógépes grakában a felülethez tartozó pontok mellett gyakran szükség van az egyes  sík normálvektorára). Vepontokban a felület normálvektorára is (azaz a felületet érinto gyünk egy példát. A tükör a fényt úgy veri vissza, hogy a megvilágítási irány, a felületi  normális és a visszaverodési irány egy síkban van, és a beesési szög megegyezik a visszave  kell rodési szöggel. Ezen (és hasonló) számítások elvégzéséhez tehát a normálvektort is elo állítani.  Az implicit egyenlet alapján az érintosík egyenletét a felület (x0 , y0 , z0 ) pont körüli el sofokú Taylor-soros közelítésével kaphatjuk: f (x, y, z)

=

+ (x − x0 ), y0 + (y − y0 ), z0 + (z − z0 )) ≈

∂f ∂f ∂f · (x − x0 ) + · (y − y0 ) + · (z − z0 ) . ∂x ∂y ∂z pontok a felületen vannak, így f (x0 , y0 , z0 ) = 0 és

f (x0 , y0 , z0 ) Az (x0 , y0 , z0 ) és (x, y, z)

f (x0

+

f (x, y, z)

=

0,

ezért az érintosík  egyenlete:

∂f ∂f ∂f · (x − x0 ) + · (y − y0 ) + · (z − z0 ) = 0 . ∂x ∂y ∂z Az egyenletet a (15.1) egyenlettel összevetve megállapíthatjuk, hogy a felület Taylor-soros

610

15. Számítógépes graka

közelítésével kapott sík normálvektora éppen

~n =

! ∂f ∂f ∂f , , = grad f . ∂ x ∂y ∂z

(15.4)

A paraméteres felület normálvektorához az izoparametrikus vonalak tanulmányozásá  val juthatunk. A v paraméter rögzítésével kapott ~ rv (u) görbe érintojét elsofokú Taylor-soros közelítéssel kapjuk:

~rv (u) = ~rv (u0 + (u − u0 )) ≈ ~rv (u0 ) +

d~ rv du

· (u − u0 ) = ~rv (u0 ) +

∂~r · (u − u0 ) . ∂u

 A közelítést az egyenes (15.2) egyenletével összevetve megállapíthatjuk, hogy az érinto irányvektora

∂~r/∂u.

 görbék érintoi  a felületet érinto  síkban vannak, A felületre illeszkedo

 görbék érintoinek   így a normálvektor a felületre illeszkedo az irányvektoraira meroleges. A   normálvektor egyértelmu  eloállításához ki kell számítanunk mind az ~ rv (u) érintojét, mind   irányvektorainak a vektoriális szorzatát kell képezni, pedig az ~ ru (v) érintojét, és a két érinto   mert a vektoriális szorzat mindkét tényezore meroleges eredményt ad. Az ~ r (u, v) felület normálvektora tehát

~n =

∂~r ∂~r × . ∂u ∂v

(15.5)

15.2.5. Görbemodellezés  leírásával a virtuális A ponthalmazok paraméteres, illetve implicit egyenletekkel történo világ geometriai tervezését egyenletek megadására, a képszintézis feladatot pedig egyenletek megoldására vezethetjük vissza. Az egyenletek azonban nagyon kevéssé szemléletesek, így a geometriai tervezésnél közvetlenül nem alkalmazhatók. Nyilván nem várhatjuk,  egy emberi arc vagy egy sportkocsi felépítése során közvetlenül ezen alakhogy a tervezo zatok egyenleteit adja meg. Indirekt módszerekre van szükségünk, amelyekben a program  ol  szemléletes információkat kér, amibol  az egyenletet automatikusan építi fel. a tervezot  Az indirekt megközelítés egyik irányzata vezérlopontokból indul ki, a másik pedig elemi  építoelemekkel (kocka, gömb, kúp stb.) és halmazmuveletekkel  dolgozik.  Tekintsük eloször a pontalapú eljárás alkalmazását görbék deniálására. Legyen a ter által kijelölt vezérlopont-sorozat ~r0 ,~r1 , . . . ,~rm , és keressünk egy ~r vezo 

= ~r(t) (t0 ≤ t ≤

tm )

 követi” a kijelölt pontokat. Egyelore nem követeljük ”  meg, hogy a görbe át is menjen a kijelölt vezérlopontokon.

paraméteres egyenletu  görbét, amely

A görbe felépítéséhez a mechanikai rendszerek súlypontjának analógiáját használjuk.  Tételezzük fel, hogy egységnyi tömegu  homokunk van, amelyet szétosztunk a vezérlopon tok között. Ha egy vezérlopontban van a homok nagy része, akkor a rendszer súlypontja is ennek közelébe kerül. Ha a t paraméter függvényében a homok eloszlását folytonosan úgy  változtatjuk, hogy mindig más vezérlopont jusson domináns szerephez, akkor a súlypont  egy görbét fut be, egymás után megközelítve a vezérlopontokat.  Legyenek a t paraméter mellett a vezérlopontokba helyezett súlyok B0 (t), B1 (t), . . . , Bm (t), amelyeket a görbe bázisfüggvényeinek nevezünk. Mivel egységnyi súlyt osztunk  azonosság: szét, megkívánjuk, hogy minden t-re fennálljon a következo m X

Bi (t) i=0

=1.

611

15.2. Ponthalmazok leírása egyenletekkel

1 b0 b1 b2 b3 0.8

0.6

0.4

0.2

0 0.2

0

0.4

0.6

0.8

1

t

 15.4. ábra. Négy vezérlopont által deniált Bézier-görbe és bázisfüggvényei (m

= 3).

Adott t-re a görbe pontját ezen mechanikai rendszer súlypontjaként értelmezzük:

Pm m X Bi (t) · ~ ri i=0 ~r(t) = P = Bi (t) · ~ ri . m i= 0

Bi (t)

i=0

Figyeljük meg, hogy azért érdemes mindig egységnyi tömegu  homokot szétosztani, mert   ekkor a tört nevezoje egységnyi lesz. A vezérlopontokat kis mágnesekként is elképzelhetjük,  erovel  amelyek a bázisfüggvényeknek megfelelo vonzzák a görbét. Ha a bázisfüggvények  sohasem lehet taszító, és a súlypont analógia is teljes (a nem negatívak, akkor ez az ero 1

súly sem lehet negatív). Egy pontrendszer súlypontja a pontok konvex burkában

van, így

 nemnegatív bázisfüggvények esetén a görbénk is a vezérlopontok konvex burkában marad. A görbék tulajdonságait a bázisfüggvények határozzák meg. Most két közkedvelt bázisfüggvény rendszert ismertetünk: a Bézier- és a B-spline-görbék bázisfüggvényeit. Bézier-görbe  A Renault gyár Pierre Bézier nevu  konstruktore a Bernstein-polinomokat javasolta bázis-

= (t + (1 − t))m binomiális tétel szerinti kifejtésével kapunk: ! m X m m (t + (1 − t)) = · ti · (1 − t)m−i . m

függvényeknek, amelyeket az 1

i=0

i

A Bézier-görbe bázisfüggvényei ezen összeg tagjai (i

!

Bezier

Bi,m

(t)

=

m i

= 0, 1, . . . , m):

· ti · (1 − t)m−i .

(15.6)

 nyilvánvaló, hogy a bázisfüggvények valóban A Bernstein-polinomok bevezetésébol teljesítik a

Pm

i= 0

Bi (t)

= 1 és Bi (t) ≥ 0 feltételeket a t ∈ [0, 1] tartományban, így a görbe min-

 dig a vezérlopontok konvex burkában marad. A görbe bázisfüggvényeit és alakját a 15.4.

1

Deníciószeruen  egy pontrendszer konvex burka az a minimális konvex halmaz, amely tartalmazza a pontrend-

szert.

612

15. Számítógépes graka

ábrán láthatjuk. A t

= 0 paraméterértékeknél a legelso bázisfüggvény 1 értéku,  a többi pedig = 1 paraméterérték-

 vezérlopontból  nulla, ezért a görbe az elso indul. Hasonló okok miatt t

 nél a görbe az utolsó vezérlopontba érkezik. A többi paraméterértéknél azonban mindegyik  bázisfüggvény pozitív, így a görbére az összes vezérlopont együttesen hat. A görbe ezért  általában nem megy át a többi vezérloponton. B-spline A második görbénk, a B-spline bázisfüggvényeit lineáris simítások sorozatával konstruál hatjuk meg. A B-spline az m + 1 darab vezérlopontot (k − 1)-edfokú bázisfüggvényekkel súlyozza. A k a görbe rendszáma, amely kifejezi a görbe simaságát. Vegyünk fel egy m + k + 1  paramétersorozatot, amelyet csomóvektornak nevezünk: elemu,  nem csökkeno t

= [t0 , t1 , . . . , tm+k ],

t0

≤ t1 ≤ · · · ≤ tm+k . bázis függvény lineáris simítás

B i,1 (t)

1

konstans bázis függvények t0 t1 t2 t3

t4

t5

t6

t7 t8

lineáris simítás

B i,2 (t)

lineáris bázisfüggvények t1

1

B i,3 (t)

t7

t5

lineáris simítás

másodfokú bázisfüggvények t2

1

t6

t5

lineáris simítás

B i,4 (t)

harmadfokú bázisfüggvények t3

t5

 o  rend két 15.5. ábra. A B-spline bázisfüggvények létrehozása. Egy magasabb rendu  bázisfüggvényt a megeloz  bázisfüggvényének lineárisan növekvo,  illetve lineárisan csökkeno  súlyozását követo  összeadáegymást követo  sával kapjuk. A vezérlopontok száma 5, azaz m ahová m

+1

=

4. Az ábrán nyíllal jelöltük a [tk−1 , tm+1 ] hasznos tartományt,

bázisfüggvény lóg be, amelyek összege itt azonosan 1. Az ábra jobb oldalán a görbék mellett a kis

  görbepontokat mutatják. háromszögek a vezérlopontokat, a körök pedig a csomóértékeknek megfelelo

 Az elsorend u,  i-edik bázisfüggvényt tekintsük 1 értékunek  az i-edik paraméterintervallumban, azon kívül pedig zérusnak (15.5. ábra):

(

BS

Bi,1 (t) Ezzel m

=

1, 0

ha ti

≤ t < ti+1 ,

különben .

+ k darab bázisfüggvényünk született, amelyek nulladfokú polinomok, nem nega∈ [t0 , tm+k ) paraméterre azonosan 1. Ezek a bázisfüggvények

tívak és összegük minden t

613

15.2. Ponthalmazok leírása egyenletekkel

annyira alacsonydimenziósak, hogy a súlypont nem is egy görbén halad végig, csak a ve zérlopontokon ugrál. A bázisfüggvények fokszámát, és ezáltal a görbe simaságát úgy növelhetjük, hogy a  szint bázisfüggvényeinek az eloállításához   két egymást kökövetkezo a jelenlegi készletbol  bázisfüggvényt lineáris súlyozással összeadunk (15.5. ábra). Az elso  bázisfüggvényt a veto ti

≤ t < ti+1 nem zérus értéku tartományában a lineárisan növekvo (t − ti )/(ti+1 − ti ) kifejezés-

 bázisfüggvényt sel szorozzuk, így a hatását lineárisan zérusról egyre növeljük. A következo pedig annak ti+1



t

<

 (ti+2 ti+2 tartományában lineárisan csökkeno

− t)/(ti+2 − ti+1 ) függ-

vénnyel skálázzuk. Az így súlyozott bázisfüggvényeket összeadva kapjuk a másodrendu   változat sátorszeru  bázisfüggvényeit. Figyeljük meg, hogy míg az elsorend u,  konstans bázisfüggvények egy-egy intervallumon voltak nem zérus értékuek,  a másodrendu,  sátorszeru   bázisbázisfüggvényekre ez már két intervallumra igaz. Mivel mindig két egymást követo  hoztunk létre egy újat, az új bázisfüggvények száma eggyel kevesebb, már csak függvénybol m

  elsorend  + k − 1 darab van belolük. A két szélso u  bázisfüggvény kivételével mindegyik

 egyszer pedig csökkeno  súlyozással épült be a másodrendu egyszer növekvo,  bázisfüggvé intervallum kivételével, azaz a [t1 , tm+k−1 ] tartományban továbbra is nyekbe, így a két szélso 2

fennáll, hogy az ide belógó m

+ k − 1 darab bázisfüggvény összege azonosan 1.

 A másodrendu  bázisfüggvények elsofokú polinomok. A bázisfüggvények fokszámát,  azaz a görbe rendjét, az ismertetett eljárás rekurzív alkalmazásával tetszoleges szintig nö rend bázisfüggvényei az alábbi módon függenek az eloz  ot  ol:  velhetjük. A következo

BS

Bi,k (t)

=

(t

(t) − ti )BBS i,k−1 ti+k−1

− ti

+

(ti+k

(t) − t)BBS i+1,k−1 ti+k

− ti+1

,

ha k

>1.

 bázisfüggvényt veszünk, és az elsot  a poFigyeljük meg, hogy mindig két egymást követo zitív tartományában (azaz abban a tartományban, ahol nem azonosan zérus) lineárisan nö pedig annak a pozitív tartományában − ti )/(ti+k−1 − ti ) függvénnyel, a következot − t)/(ti+k − ti+1 ) függvénnyel szorozzuk meg. Az eredményeket összeadva megkapjuk a még simább bázisfüggvényeket. A muveletsort  (k − 1)-szer meg a [tk−1 , tm+1 ] hasznos tartoismételve k-adrendu  bázisfüggvényekhez jutunk, amelyekbol mányba éppen m + 1 darab lóg be, amelyek összege továbbra is azonosan 1. A csomóvektor  (t vekvo

 (ti+k lineárisan csökkeno

 sorozatot megadásánál megengedtük, hogy a csomóértékek ne szigorúan monoton növekvo alkossanak, így az egyes intervallumok hossza akár zérus is lehet. Ez 0/0 jellegu  törtekhez vezethet, amelyeket az algoritmus megvalósítása során 1 értékkel kell helyettesíteni.  Cox-deBoor algoritA k-adrendu  i-edik bázisfüggvény értékét a t helyen a következo mussal számíthatjuk:

2

Akkor mondjuk, hogy a bázisfüggvény egy intervallumba lóg, ha értéke ebben az intervallumban nem azonosan

zérus.

614

15. Számítógépes graka

B-(i, k, t, t) 1 2

if k

=1

B Triviális eset vizsgálata.

then if ti

3

≤ t < ti+1

then return 1

4

else return 0

11

− ti > 0  o  lineárisan növekvo  súllyal. then b1 ← (t − ti )/(ti+k−1 − ti ) B Eloz else b1 ← 1 B Itt: 0/0 = 1. if ti+k − ti+1 > 0 then b2 ← (ti+k − t)/(ti+k − ti+1 ) B Következo lineárisan növekvo súllyal. else b2 ← 1 B Itt: 0/0 = 1. B ← b1 · B-(i, k − 1, t, t) + b2 · B-(i + 1, k − 1, t, t) B Rekurzió.

12

return B

5 6 7 8 9 10

if ti+k−1

cm

c1

c0

p

m

p

c m+1

1

p

0

c2

p

2

c3

c-1 15.6. ábra. A B-spline interpoláció. A ~ p0 , . . . , ~ pm interpolálandó pontok alapján számítjuk a ~ c−1 , . . . , ~ cm+1 vezér  és végpontjai éppen az interpolálandó pontok legyenek. lopont sorozatot úgy, hogy az egyes szegmensek kezdo-

A gyakorlatban a bázisfüggvényeket negyedrendunek  választjuk (k

=

4), amelyek har-

madfokú polinomok, a görbe pedig kétszer folytonosan differenciálható. Ennek az a magya mozgásrázata, hogy a meghajlított rudak alakja és a newtoni mozgástörvényeket kielégíto pályák ugyancsak kétszer folytonosan differenciálhatók.  Amíg a vezérlopontok száma a görbe rendszámánál nagyobb, az egyes bázisfüggvények csak az érvényes paramétertartomány egy-egy részében nem nulla értékuek.  Ez azt jelenti,  hogy egy vezérlopont csak a görbe egy részére hat, így megváltoztatása a görbét csak loká tulajdonság, hiszen ekkor a tervezot  nem fenyegeti lisan módosítja. Ez egy nagyon kedvezo az a veszély, hogy a görbe egy részének kicsiny módosítása elrontja a görbe alakját távolabb.  A negyedrendu  B-spline általában nem megy át a vezérlopontjain. Ha interpolációs  célokra szeretnénk használni, a görbe vezérlopontjait az interpolálandó pontokból kell kiszámítani. Tegyük fel, hogy egy olyan görbét keresünk, amely a t0

= 0, t1 = 1, . . . , tm =

m

paraméterértékeknél éppen a ~ p0 , ~ p1 , . . . , ~ pm pontokon megy át (15.6. ábra). Ehhez a görbénk   interpolációs fel[~ c−1 , ~ c0 , ~ c1 , . . . , ~ cm+1 ] vezérlopontjait úgy kell kitalálni, hogy a következo tétel teljesüljön:

~r(t j ) =

m+1 X

~ci · BBS (t j ) = ~ p j, i, 4

j

= 0, 1, . . . , m .

i=−1

Ez egy m

+ 3 ismeretlenes lineáris egyenletrendszer m + 1 egyenletét határozza meg, tehát

több megoldás is lehetséges. A feladatot teljesen meghatározottá tehetjük, ha még két járulékos feltételt felveszünk, azaz megadjuk például a görbénk deriváltját (mozgásgörbéknél a

615

15.2. Ponthalmazok leírása egyenletekkel

 és a végpontban. sebességet) a kezdo A B-spline görbék egy fontos továbbfejlesztésében az i-edik vezérlopont hatását a Bi (t)  B-spline bázisfüggvény aktuális paraméter melletti értéke és a vezérlopont saját wi súlyté nyezojének szorzata adja meg. A görbe neve NURBS, amely a jelenlegi geometriai terve zorendszerek egyik legfontosabb eszköze.  A szokásos mechanikai analógiánkban a NURBS görbénél egy vezérlopontba wi Bi (t) súlyt teszünk, így a rendszer súlypontja:

Pm

i=0

~r(t) = Pm

BS

wi Bi

j=0

(t)

· ~ri

=

BS

w j B j (t)

m X

NURBS

Bi

(t)

· ~ri .

i=0

 A B-spline és a NURBS bázisfüggvények közötti kapcsolat tehát a következo: BS

NURBS

Bi

(t)

wi Bi

= Pm

j=0

(t) BS

w j B j (t)

.

Mivel a B-spline bázisfüggvények polinomok, a NURBS bázisfüggvények két polinom hányadosaként írhatók fel. A NURBS görbék a másodrendu  görbéket (például kört, ellipszist stb.) közelítési hiba nélkül képesek leírni.

15.2.6. Felületmodellezés A parametrikus felületek kétváltozós ~ r (u, v) függvényekkel adhatók meg. A függvény köz vetlen megadása helyett véges számú ~ ri j vezérlopontot veszünk fel, amelyeket a bázisfüggvényekkel súlyozva kapjuk meg a felületet leíró függvényeket:

~r(u, v) =

n X m X

i= 0

~ri j · Bi j (u, v) .

(15.7)

j= 0

 továbbra is elvárjuk, hogy összegük minden paraméterre egységnyi A bázisfüggvényektol legyen, azaz

Pn Pm i=0

j=0

Bi j (u, v)

=

1 mindenütt fennálljon. Ekkor ugyanis a súlypont ana-

  függo  Bi j (u, v) lógia szerint most is képzelhetjük úgy, mintha a vezérlopontokban u, v-tol súlyok lennének, és a rendszer súlypontját tekintjük a felület ezen u, v párhoz tartozó pontjának. A Bi j (u, v) bázisfüggvények deníciójánál visszanyúlhatunk a görbéknél megismert eljárásokra. Rögzítsük gondolatban a v paraméter értéket. Az u paraméterértéket szabadon változtatva egy ~ rv (u) görbét kapunk, amely a felületen fut végig. Ezt a görbét a megismert görbetervezési eljárásokkal adhatjuk meg:

~rv (u) =

n X

Bi (u)

· ~ri ,

(15.8)

i=0

ahol a Bi (u) a kívánt görbe bázisfüggvénye. Természetesen, ha más v értéket rögzítünk, akkor a felület más görbéjét kell kapnunk.   Mivel egy adott típusú görbét a vezérlopontok egyértelmuen  deniálnak, az ~ ri vezérlopon Ahogy a v változik, az ~ toknak függeniük kell a rögzített v paramétertol. ri

= ~ri (v) ugyancsak

616

15. Számítógépes graka

 u és v értékek rögzítésével kapott – vonalai. 15.7. ábra. Felületek izoparametrikus – azaz különbözo

 egy görbén fut végig, amit érdemes ugyanazon görbetípussal az ~ ri,0 ,~ ri,2 , . . . ,~ ri,m vezérlopontok segítségével felvenni:

~ri (v) =

m X

B j (v)

· ~ri j .

j= 0

 Ezt behelyettesítve a (15.8) egyenletbe, a felület paraméteres függvénye a következo lesz:

~r(u, v) = ~rv (u) =

n X

i=0

  m n X m  X X   = Bi (u)B j (v) · ~ ri j . B j (v) · ~ ri j  Bi (u)   j=0

i= 0

j= 0

 A görbékkel összehasonlítva most a vezérlopontok egy kétdimenziós rácsot alkotnak, a kétváltozós bázisfüggvényeket pedig úgy kapjuk, hogy a görbéknél megismert bázisfüggvények u-val és v-vel parametrizált változatait összeszorozzuk.

15.2.7. Testmodellezés buborékokkal A szabad formájú, amorf testek létrehozását – a parametrikus görbékhez és felületekhez   hasonlóan – a vezérlopontok megadására vezetjük vissza. Rendeljünk minden ~ ri vezérlo  ponthoz egy h(Ri ) hatásfüggvényt, amely kifejezi a vezérlopont hatását egy tole Ri

= |~r − ~ri |

 pontban. Összetett testnek azokat a pontokat tekintjük, ahol a hatások távolságban lévo összege egy alkalmas T küszöbérték felett van (15.8. ábra):

f (~ r)

=

m X

hi (Ri )

− T ≥ 0,

ahol Ri

= |~r − ~ri | .

i= 0

Egy hatásfüggvénnyel egy gömböt írhatunk le, a gömbök pedig cseppszeruen  össze a végtelenben nullához tartó olvadnak (15.8. ábra). A pont hatását bármilyen csökkeno, folytonos függvénnyel kifejezhetjük. Például Blinn a hi (R)

=

ai

· e−b R i

2

hatásfüggvényeket

javasolta a csepp módszerében.

15.2.8. Konstruktív tömörtest geometria A testmodellezés másik irányzata, a konstruktív tömörtest geometria az összetett testeket  halmazmuveletek primitív testekbol  (egyesítés, metszet, különbség) ismételt alkalmazásával építi fel (15.9. és 19.10. ábra). A primitív testek általában a téglatestet, a gömböt, a gúlát,

617

15.2. Ponthalmazok leírása egyenletekkel

h(R)

T

R

összegzés

kivonás

 15.8. ábra. A hatás a távolsággal csökken. Az azonos elojel u  hatásfüggvények által leírt gömbök összeolvadnak,  elojel  a különbözo uek  csökkentik egymás hatását.

15.9. ábra. A konstruktív tömörtest geometria alapmuveletei  egy f implicit függvényu  kúpra és egy g implicit függvényu  gömbre: egyesítés (max( f , g)), metszet (min( f , g)) és különbség (min( f , −g)).

U \ U U 15.10. ábra. Összetett objektum felépítése halmazmuveletekkel.  A gyökere az összetett objektumot, a levelei a primitíveket azonosítják. A többi csomópont a halmazmuveleteket  adja meg (U: egyesítés,

\: különbség).

618

15. Számítógépes graka

a kúpot, a félteret stb. foglalják magukban, amelyek implicit függvényei ismertek.  testek implicit függA halmazmuvelet  eredményének implicit függvényét a résztvevo  kifejezhetjük: vényeibol



f és g metszete: min( f , g);



f és g egyesítése: max( f , g).



f komplemense:



f és g különbsége: min( f , −g).

− f.

 TeAz implicit függvények segítségével két test közötti átmenet is könnyen kezelheto. gyük fel, hogy két testünk van, például egy kocka és egy gömb, amelyek implicit függvényei  egy olyan testet, amely t részben az elso  objektumhoz, (1 f1 és f2 . Ebbol

− t) részben pedig

a második objektumhoz hasonlít, az f

mor ph

(x, y, z)

=t·

f1 (x, y, z)

+ (1 − t) ·

f2 (x, y, z)

 egyenlettel állíthatunk elo.

Gyakorlatok 15.2-1. Írjuk fel a tórusz paraméteres egyenletét.   [0,0,0,0,1,1,1,1] csomóvektorú, 15.2-2. Bizonyítsuk be, hogy a 4 vezérlopontra illeszkedo, negyedrendu  B-spline egy Bézier-görbe. 15.2-3. Adjuk meg a lobogó zászló és az egy pontból induló hullámfelület paraméteres  egyenleteit, és a normálvektoraikat is egy tetszoleges pontban.  két és utolsó két vezérlopont  15.2-4. Bizonyítsuk be, hogy a Bézier-görbe érinti az elso közötti szakaszokat. 15.2-5. Vezessük le a másod-, harmad- és negyedrendu  B-spline görbe bázisfüggvényeinek képletét. 15.2-6. Készítsünk algoritmust a Bézier-görbék és B-spline görbék ívhosszának meghatározására két paraméterérték között. Az ívhossz számítás alapján vezessünk végig egy pontot egyenletes sebességgel a görbén.

15.3. Geometriai feldolgozó és tesszellációs algoritmusok A 15.2. alfejezetben megismerkedtünk azokkal a paraméteres és implicit függvényeket használó eljárásokkal, amelyekkel görbéket és felületeket írhatunk le. A képszintézis so rán különösen nagy jelentoségük van a szakaszoknak és a háromszögeknek, ezért ebben a fejezetben olyan eljárásokat ismertetünk, amelyek más reprezentációkat szakaszokkal vagy háromszögekkel közelítenek, illetve, amelyek szakaszokkal vagy háromszögekkel leírt modelleket alakítanak át. A végpontjaikban egymáshoz kapcsolódó szakaszok sorozatát tö gyujteményét röttvonalnak, a háromszögek élekben illeszkedo  pedig háromszöghálónak  eljárások neve vektorizáció, és kimenete egy, a nevezzük. A görbéket töröttvonallal közelíto  tesszeltöröttvonal csúcsait megadó pontsorozat. A felületeket háromszöghálókkal közelíto  ahol az egyes háromszögeket lációs algoritmusok pedig háromszögek sorozatát állítják elo, a csúcspontjaikkal adjuk meg. Gyakran a fényforrások hatásának számításához a csúcspontokban az eredeti felület normálvektorait is tároljuk, így végül egy háromszöghöz három

619

15.3. Geometriai feldolgozó és tesszellációs algoritmusok

pont és három normálvektor tartozik. A háromszöghálókat feldolgozó eljárások még további topológiai információkat is felhasználnak, például azt, hogy egy csúcsra mely lapok és élek illeszkednek, és egy élben mely lapok találkoznak.

15.3.1. Sokszög és poliéder 15.2. deníció. Egy sokszög vagy más néven poligon a síknak véges sok szakasszal határolt, korlátos, azaz egyenest nem tartalmazó része. A sokszöget a határoló szakaszokat tartalmazó zárt töröttvonalak felsorolásával deniáljuk. Egy töröttvonalat a csúcsaival adunk meg.

(a)

(b)

(c)

 (c) többszörösen össze15.11. ábra. A sokszögek fajtái. (a): egyszeru;  (b) nem egyszeru,  egyszeresen összefüggo;  függo.

15.3. deníció. Egy sokszög egyszeresen összefüggo,  ha egyetlen zárt töröttvonal határolja (15.11. ábra). 15.4. deníció. Egy sokszög egyszeru,  ha egyszeresen összefüggo,  és a határoló töröttvonal nem metszi saját magát (15.11(a) ábra).   el, hogy a sokszög belsejében van-e, hogy Egy tetszoleges síkbeli pontról úgy döntheto  metszésegy félegyenest indítunk a pontból, és megszámláljuk a sokszög éleivel keletkezo pontokat. Ha a metszéspontok száma páratlan, akkor a pont a sokszög belsejében, egyébként a külsejében van.  sokszögbol  sokszögháA háromdimenziós térben több, nem feltétlenül egy síkban lévo lókat építhetünk fel. Két sokszöget szomszédosnak mondunk, ha van közös élük. 15.5. deníció. Egy poliéder egy olyan korlátos, azaz egyenest nem tartalmazó térrész, amelyet véges sok sokszög határol.   el, hogy a poliéderhez A sokszöghöz hasonlóan, egy tetszoleges pontról úgy döntheto tartozik-e, hogy egy félegyenest indítunk a pontból, és megszámláljuk a poliéder lapjaival  metszéspontokat. Ha a metszéspontok száma páratlan, akkor a pont a poliéder keletkezo belsejében, egyébként a külsejében van.

15.3.2. Paraméteres görbék vektorizációja A paraméteres görbék a [tmin , tmax ] intervallumot képezik le a görbe pontjaira. A vektorizáció során a paraméterintervallumot osztjuk fel. A legegyszerubb  felbontás a t tartományt N

620

15. Számítógépes graka

részre bontja fel, és az így kialakult ti

= tmin + (tmax − tmin ) · i/N

(i

= 0, 1, . . . , N) paraméte-

 kapott ~ rértékekbol r (ti ) pontokra illeszt töröttvonalat.

15.3.3. Egyszer¶ sokszögek háromszögekre bontása A célként megfogalmazott háromszögsorozathoz az egyszeru  sokszögek állnak a legköze lebb, ezért eloször ezek háromszögesítésével foglalkozunk. Konvex sokszögekre a feladat  egyszeru,  egy tetszoleges csúcspontot kiválasztva, és azt az összes többivel összekötve, a   Konkáv sokszögeknél azonban ez az út nem járható, felbontás lineáris idoben elvégezheto.   szakasz nem a sokszög belsejében fut, ugyanis elofordulhat, hogy a két csúcsot összeköto így ez a szakasz nem lehet valamelyik, a sokszöget felbontó háromszög oldala.  denícióval: Kezdjük két alapveto

r2

r1 r0

átló

r3

r4

fül

15.12. ábra. A sokszög átlója és füle.

15.6. deníció. Egy sokszög átlója egy, a sokszög két csúcsát összeköto  olyan szakasz, amely teljes egészében a sokszög belsejében van (15.12. ábra).   ha azt az összes oldallal megpróbáljuk Az átló tulajdonság egy szakaszra úgy ellenorizhet o, elmetszeni és megmutatjuk, hogy metszéspont csak a végpontokban lehetséges, valamint azt   pontja a sokszög belsejében is, hogy az átlójelölt egy tetszoleges, a végpontoktól különbözo  van. Ez a tetszoleges pont lehet például a jelölt középpontja. Egy pontról a 15.4.1. pontban  el, hogy egy sokszög belsejében van-e. tárgyalt eljárással döntheto 15.7. deníció. A sokszög egy csúcsa fül, ha az adott csúcsot megeloz  o  és követo  csúcsokat összeköto  szakasz a sokszög átlója (15.12. ábra).  szög 180 foknál nem naNyilván csak azok a csúcsok lehetnek fülek, amelyekben a belso gyobb. Az ilyen csúcsokat konvex csúcsoknak nevezzük, a nem konvexeket pedig konkáv csúcsoknak.  alapveto  tételeket: Az egyszeru  sokszögekre kimondhatjuk a következo 15.8. tétel. Egy egyszeru  sokszögnek mindig van átlója. Bizonyítás. Legyen a háromszög legbaloldalibb (minimális x koordinátájú) csúcsa ~ ri , a két szomszédos csúcs pedig ~ ri−1 , illetve ~ ri+1 (15.13. ábra). A legbaloldalibb tulajdonság miatt az ~ ri konvex csúcs. Ha az ~ ri fül, akkor az (~ ri−1 ,~ ri+1 ) szakasz átló (15.13. ábra bal oldala), így az állítást erre az esetre beláttuk. Mivel az ~ ri konvex csúcs, csak akkor nem fül, ha az ~ ri−1 ,

~ri , ~ri+1

háromszög tartalmaz legalább egy poligon csúcspontot (15.13. ábra jobb oldala).

 egyenestol  Válasszuk ki a tartalmazott csúcspontok közül az ~ ri−1 ,~ ri+1 pontokra illeszkedo

621

15.3. Geometriai feldolgozó és tesszellációs algoritmusok

 a legtávolabbit, és helyvektorát jelöljük ~ p-vel. Mivel ~ p-nél nincs az (~ ri−1 ,~ ri+1 ) egyenestol távolabbi csúcs, a ~ p és ~ ri között nem futhat él, tehát a ( ~ p,~ ri ) szakasz átló.

ri-1

ri-1

p

átló ri

ri

átló

y

x

ri+1

ri+1

15.13. ábra. Az átló létezésének bizonyítása egyszeru  sokszögre.

15.9. tétel. Egy egyszeru  sokszög az átlóival mindig háromszögekre bontható. Ha a sokszög csúcsainak száma n, akkor a keletkezo  háromszögek száma n

− 2.

Bizonyítás. A tétel igazolásához teljes indukciót használunk. Az állítás n

=

egyetlen háromszögre nyilván igaz. Tegyük fel, hogy az állítás minden m (m

3 esetre, azaz

= 3, . . . , n − 1)

 o  tétel szerint az n szögnek van csúcsú sokszögre igaz, és vegyünk egy n szöget. Az eloz átlója, tehát felbonthatjuk egy átlója mentén egy n1 szögre és egy n2 szögre, ahol n1 , n2 és n1

< n, + n2 = n + 2, hiszen az átló végén lévo két csúcs mindkét sokszögben megjelenik. Az

indukciós feltétel értelmében a két sokszöget külön-külön háromszögekre bonthatjuk, ami az eredeti sokszög háromszögekre bontását adja. A háromszögek száma pedig n1 2

− 2 + n2 −

= n − 2. A sokszögek felbontási tételének bizonyítása konstruktív, így közvetlenül sugall egy

felbontási algoritmust: vegyük sorra a lehetséges átlójelölteket, és egy tényleges átló mentén bontsuk fel a sokszöget, végül rekurzívan folytassuk az eljárást a két új sokszögre. Ennek az algoritmusnak a futási ideje

Θ(n3 )

(az átlójelöltek száma ugyanis

Θ(n2 ),

az

 Θ(n)). A következokben ezért egy másik, egyszeru  algoritkonvex vagy konkáv ~ r0 ,~ r1 , . . . ,~ rn sokszöget háromszögekre

 átló ellenorzésének ideje pedig must ismertetünk, amely egy oszt fel.

A háromszögekre bontó fülvágó algoritmus füleket keres, és azokat levágja addig, amíg egyetlen háromszögre egyszerusödik  az eredeti sokszög. Az algoritmus az ~ r2 csúcstól indul.    o  csúcspont fülAmikor egy csúcsot dolgozunk fel, eloször ellenorizzük, hogy a megeloz  csúcspontra lépünk. Ha a megeloz  o  csúcs fül, akkor a két e. Ha az nem fül, a következo  o  és az aktuális csúcsból egy háromszöget hozunk létre, és a megeloz  o  csúcsot töröljük eloz  o  csúcspont éppen a 0 a sokszög csúcsai közül. Ha a törlés után az aktuális csúcsot megeloz  csúcspontra lépünk. indexu,  akkor a következo  amíg talál fület, a befejezodését  Az algoritmus egy háromszöget vág le a sokszögbol  két fül tétel pedig az biztosítja, hogy minden egyszeru  sokszögnek van füle. Az következo  származik. alábbi bizonyítása Joseph O'Rourke-tol 15.10. tétel. Egy egyszeru,  legalább négy csúcsú sokszögnek mindig van legalább két, nem szomszédos, így egymástól függetlenül levágható, füle.

622

15. Számítógépes graka

Bizonyítás. A 15.9. tétel értelmében minden egyszeru  sokszög háromszögekre bontható  háromszögek oldalai a sokszög élei vagy pedig átlói. A háromszöúgy, hogy a keletkezo geket feleltessük meg egy gráf csomópontjainak, és két csomópont közé akkor vegyünk fel  gráf összefüggo,  és egy élt, ha a két háromszög egy sokszögátlón osztozik. A keletkezo nincsenek benne körök, tehát fagráf, amelynek neve duális fa. A sokszög csúcsainak száma  Minden, legalább két legalább négy, így a fagráf csomópontjainak száma legalább ketto. 3

csomópontból álló fagráfnak legalább két levele

 háromszövan. A leveleknek megfelelo

gek pedig fülek.

A két fül tétel miatt az algoritmusunk O(n) lépésben mindig talál levágandó fület, 2

amelynek eltávolításával a sokszög csúcsainak száma eggyel csökken, így az eljárás O(n )  lépésben befejezodik.

15.3.4. Paraméteres felületek tesszellációja A paraméteres felületek a paramétertartomány egy [umin , umax ]

× [vmin , vmax ] téglalapját ké-

pezik le a felület pontjaira.

rv (u)

ru (v) 15.14. ábra. Paraméteres felületek tesszellációja.

A tesszelláció elvégzéséhez a paramétertéglalapot háromszögesítjük. A paraméter há háromszögek csúcsaira alkalmazva a paraméteres egyenletet, éppen a felületet közelíto romszöghálóhoz jutunk. A legegyszerubb  felbontás az u tartományt N részre, a v-t pedig M részre bontja fel, és az így kialakult

 [ui , v j ]

=

umin

i

+ (umax − umin ) , N

vmin

+ (vmax − vmin )

j



M

párokból kapott pontok közül az ~ r (ui , v j ), ~ r (ui+1 , v j ), ~ r (ui , v j+1 ) ponthármasokra, ~r(ui+1 , v j ), ~r(ui+1 , v j+1 ), ~r(ui , v j+1 ) ponthármasokra háromszögeket illeszt.

illetve az

A tesszelláció lehet adaptív is, amely csak ott használ kis háromszögeket, ahol a felület  és bontsuk gyors változása ezt indokolja. Induljunk ki a paraméter tartomány négyzetébol fel két háromszögre. A háromszögesítés pontosságának vizsgálatához a paramétertérben  háromszög élfelezoihez   háromlévo tartozó felületi pontokat összehasonlítjuk a közelíto

3

A levél olyan csúcs, amelyhez pontosan 1 él kapcsolódik.

623

15.3. Geometriai feldolgozó és tesszellációs algoritmusok

 pontjaival, azaz képezzük a következo  távolságot (15.15. ábra): szög élfelezo

 u1 + u2 v1 + v2  ~r(u1 , v1 ) + ~r(u2 , v2 ) , − , ~r 2 2 2

ahol (u1 , v1 ) és (u2 , v2 ) az él két végpontjának a paramétertérbeli koordinátái.

hiba

15.15. ábra. A tesszellációs hiba becslése.

Ha ez a távolság nagy, az arra utal, hogy a paraméteres felületet a háromszög rosszul közelíti, tehát azt fel kell bontani kisebb háromszögekre. A felbontás történhet úgy, hogy  felezopont  a háromszöget két részre vágjuk a legnagyobb hibával rendelkezo és a szemben  csúcs közötti súlyvonal segítségével, vagy pedig úgy, hogy a háromszöget négy részre lévo  vágjuk a három felezovonala segítségével. Az adaptív felbontás nem feltétlenül robusztus,   ugyanis elofordulhat, hogy a felezoponton a hiba kicsi, de a háromszög mégsem közelíti jól a paraméteres felületet.   két háromszög Az adaptív felbontásnál elofordulhat, hogy egy közös élre illeszkedo  ponton átmeno  súlyvonallal felbontjuk, de a másikat nem, így közül az egyiket az élfelezo  háromszög nem illeszkedik a másik oldalon lévo  két a felbontás után az egyik oldalon lévo  pontokat T csomópontmásikhoz, azaz a felületünk kilyukad. Az ilyen problémás élfelezo nak nevezzük (15.16. ábra).

felosztás T csomópont új T csomópont rekurzív felosztás  15.16. ábra. T csomópontok és kiküszöbölésük eroszakos felosztással.

 Amennyiben a felosztást mindig csak arra az élre végezzük el, amelyik megsérti az eloírt, csak az él tulajdonságain alapuló hibamértéket, T csomópontok nem jelenhetnek meg. Ha a felosztásban az él tulajdonságain kívül a háromszög egyéb tulajdonságai is szerepet játszanak, akkor viszont fennáll a veszélye a T csomópontok feltunésének,  amit úgy hárítha háromszögre is kieroszakoljuk  tunk el, hogy ekkor rekurzívan arra az illeszkedo a felosztást, amelyre a saját hibakritérium alapján nem tettük volna meg.

624

15. Számítógépes graka

15.3.5. Töröttvonal és felület simítás, felosztott görbék és felületek Ebben a pontban olyan algoritmusokat ismertetünk, amelyek a töröttvonal és sokszögháló modelleket simítják, azaz a töröttvonalat és sokszöghálót több vonalból, illetve lapból álló olyan változatokkal cserélik fel, amelyek kevésbé tunnek  szögletesnek.

ri hi-1

ri+1 hi

ri ’

ri-1 =1/2 Σ

=1/2 Σ +1/4 Σ

 15.17. ábra. Felosztott görbe létrehozása: minden lépésben felezopontokat veszünk fel, majd az eredeti csúcspon tokat a szomszédos felezopontok és a csúcspont súlyozott átlagára helyezzük át.

 Tekintsük eloször az ~ r0 , . . . ,~ rm töröttvonalat. Egy látszólag simább töröttvonalhoz ju a vezérlopontokat  tunk a következo, megduplázó eljárással (15.17. ábra). Minden szakaszt

  megfelezünk és a felezopontokban egy-egy új ~ h0 , . . . , ~ hm−1 vezérlopontot veszünk fel. Bár

 már kétszer annyi vezérlopontunk van, a görbénk éppen annyira szögletes, mint eredetileg  volt. A régi vezérlopontokat ezért úgy módosítjuk, hogy azok a régi helyük és a két oldalu felezopontok  kon lévo közé kerüljenek, az alábbi súlyozással:

~ri 0 =

1 2

1 1 ~ri + ~hi−1 + ~hi = 4

4

3 4

1

1

8

8

~ri + ~ri−1 + ~ri+1 .

Az új töröttvonal valóban sokkal simábbnak látszik. Ha még ez sem elégít ki bennünket, az  eljárást tetszoleges mélységig ismételhetjük. Ha végtelen sokszor tennénk ezt, akkor éppen  a B-spline-t állítanánk elo.

=1/4 Σ

=1/4 Σ +1/4 Σ

=1/2

+1/16 Σ

+1/16 Σ

  környeze15.18. ábra. A Catmull–Clark-felosztás egy lépése. Eloször a lappontokat számítjuk, majd az élfelezok tében veszünk fel átlagolással egy pontot, végül pedig az eredeti csúcspontokat módosítjuk a környezet átlagának  megfeleloen.

 háromdimenziós hálókra, amelynek eredménye Az eljárás közvetlenül kiterjesztheto

15.3. Geometriai feldolgozó és tesszellációs algoritmusok

625

15.19. ábra. Az eredeti háló, valamint egyszer, kétszer és háromszor felosztott változatai.

a Catmull–Clark felosztott felület. Induljunk ki egy háromdimenziós négyszöghálóból (15.18. ábra) (az algoritmus nemcsak négyszögeket képes felosztani, de a létrehozott lapok  lépésként minden él közepén felveszünk egy-egy élpontot mint mindig négyszögek). Elso az él két végpontjának az átlagát, és minden lap közepén egy-egy lappontot mint a négyszög négy csúcspontjának az átlagát. Az új élpontokat a lappontokkal összekötve ugyanazt  a felületet négyszer annyi négyszöggel írtuk le. A második lépésben kezdodik a simítás,  lapok lappontjai alapján úgy, hogy az amikor az élpontokat módosítjuk az élhez illeszkedo  csúcspont átlaga legyen. Ugyanezt új élpont éppen a két lappont és az él két végén levo  két lap négy-négy eredeti saaz új élpontot úgy is megkaphatjuk, hogy az élre illeszkedo rokpontjának, valamint az él két végpontjának képezzük az átlagát (azaz az él végpontjait háromszor szerepeltetjük az átlagban). A simítás utolsó lépésében az eredeti csúcspontok új helyét súlyozott átlaggal határozzuk meg, amelyben az eredeti csúcspont 1/2 súlyt, az illesz élek összesen 4 módosított élpontja és az illeszkedo  lapok összesen 4 lappontja pedig kedo 1/16 súlyt kap. Az eljárást addig ismételjük, amíg a felület simasága minden igényünket ki nem elégíti (15.19. ábra). Ha a háló egyes éleinek és csúcsainak környezetét nem szeretnénk simítani, akkor a   éleken túl lévo  pontokat nem vonjuk be az átlagolási muveletekbe. megorzend o 

-1/16-w

1/2

1/2

-1/16-w

-1/16-w

1/8+2w

1/8+2w

-1/16-w

15.20. ábra. Az új élpont meghatározása és a háromszög pillangó felosztása.

626

15. Számítógépes graka

A Catmull–Clark-felosztással kapott felület általában nem megy át az eredeti háló  pillangó feloszcsúcspontjain. Ezt a hátrányt küszöböli ki a háromszöghálókon muköd  o  pontjainak közelébe egy-egy új élpontot tás. A pillangó felosztás a háromszögek élfelezo helyez, majd az eredeti háromszögeket négy új háromszöggel váltja fel. Az új háromszö pontjai gek csúcsai egyrészt az eredeti háromszög csúcsai, másrészt a módosított élfelezo  háromszögek csúcspontjai és (15.20. ábra). Az élpontok kialakításában az élre illeszkedo az ezen két háromszöggel közös élt birtokló még további négy háromszög vesz részt. Az élpontra ható háromszögek elrendezése egy pillangóra emlékeztet, ami magyarázza az eljárás elnevezését. Az élpont koordinátáit az él végpontjainak koordinátáiból számítjuk 1/2-es  két háromszög harmadik csúcsaiból 1/8 súlyozással, az élre illeszkedo

+ 2w

súlyozással,

 két háromszöghöz tapadó négy háromszögnek az illeszkedo  hávalamint az élre illeszkedo  csúcsaiból −1/16−w súlyozással. A w a muvelet romszögön kívül lévo  paramétere, amellyel azt állíthatjuk be, hogy az eljárás mennyire görbítse meg a felületet az élek környezetében. A w

= −1/16-os

beállítás megtartja a háló szögletességét, a w

=

0-t használó felosztás

 pedig erosen lekerekíti az eredeti éleket.

15.3.6. Implicit felületek tesszellációja  Egy implicit egyenlettel leírt test felületének háromszöghálós közelítését úgy állíthatjuk elo,  hogy elegendoen sur  un  olyan pontokat keresünk, amelyekre az f (x, y, z)



0 teljesül, és a

közeli pontokat összekötve háromszöghálót építünk fel.  Eloször az f függvényt a háromdimenziós koordinátarendszer rácspontjaiban kiértékeljük és az eredményt egy háromdimenziós tömbben, úgynevezett voxeltömbben tároljuk. A továbbiakban két rácspontot szomszédosnak nevezünk, ha két koordinátájuk páronként megegyezik, a harmadik koordináták különbsége pedig éppen az adott tengely menti rácsállandó. A rács pontjaiban ismerjük a függvény pontos értékét, a szomszédos rácspontok közötti változást pedig általában lineárisnak tekintjük. Az árnyaláshoz szükséges normálvektorokat a mintapontokban az f függvény gradienseként számítjuk (15.4. egyenlet), amelyet a rácspontok között ugyancsak lineárisan interpolálunk. A voxeltömb alkalmazása azt jelenti, hogy az eredeti f függvény helyett a továbbiak arra utal, ban annak egy voxelenként tri-lineáris közelítésével dolgozunk (a tri-lineáris jelzo  függvényben bármely két koordinátaváltozó rögzítésével a harmadik koorhogy a közelíto dinátában a függvény lineáris). A lineáris közelítés miatt egy – két szomszédos rácspont  felületet, hiszen a lineáris függvénynek közötti – él legfeljebb egyszer metszheti a közelíto legfeljebb egyetlen gyöke lehet. A rácspontokat olyan sur  un  kell felvenni, hogy a tri-lineáris közelítés során ne veszítsünk el gyököket, azaz a felület topológiája ne változzon.  módszer neve masírozó kockák algoritmus. Az A felületet háromszöghálóval közelíto  algoritmus a mintavételezett érték elojele alapján minden mintavételezési pontra eldönti, hogy az a test belsejében vagy azon kívül van-e. Ha két szomszédos mintavételezési pont  típusú, akkor közöttük felületnek kell lennie. A határ helyét és az itt érvényes noreltéro málvektort a szomszédos mintavételezési pontok közötti élen az értékek alapján végzett lineáris interpolációval határozhatjuk meg. Ha az egyik mintavételezési pont helyvektora

~r1 , a szomszédos mintavételi ponté pedig ~r2 , és az f implicit függvény a két pontban eltéro  elojel u,  akkor a tri-lineáris felület és az (~ r1 ,~ r2 ) szakasz ~ ri metszéspontja, valamint a felület ~ni normálvektora:

15.3. Geometriai feldolgozó és tesszellációs algoritmusok

627

15.21. ábra. Egy voxelenkénti tri-lineáris implicit függvényu  felület és egy voxel lehetséges metszetei. A 256-ból  eset választható ki, amelyekbol  a többiek forgatással eloállíthatók.  ez a 15 topológiailag különbözo Az ábrán az  azonos elojel u  mintavételezett értékeket körrel jelöltük.

f (~ r2 )

f (~ r1 ) + ~r2 · , − f (~r1 ) f (~ r2 ) − f (~ r1 ) f (~ r1 ) f (~ r2 ) ~ni = grad f (~r1 ) · + grad f (~r2 ) · . f (~ r2 ) − f (~ r1 ) f (~ r2 ) − f (~ r1 )

~ri = ~r1 ·

f (~ r2 )

 összeáll a köVégül az éleken kijelölt pontokra háromszögeket illesztünk, amelyekbol  felület. A háromszögillesztéshez gyelembe kell venni, hogy a tri-lineáris felület a zelíto  kocka éleinek mindegyikét legfeljebb egyszomszédos mintavételezési pontokra illeszkedo  mintavételezési pontszer metszheti. Metszéspont akkor keletkezik, ha az él két végén lévo  elojel   ban a függvényérték eltéro u.  A kocka 8 csúcsán érvényes elojelek alapján 256 eset  végül 15 topológiailag különbözo  konguráció különítheto  el (15.21. lehetséges, amibol ábra).  Az algoritmus sorra veszi az egyes voxeleket és megvizsgálja a csúcspontok elojeleit.  Rendeljünk a negatív elojelhez 0 kódbitet, a nem negatívhoz 1-et. A 8 kódbit kombinációja  kódszónak tekintheto,  amely éppen az aktuális metszési esetet egy 0–255 tartományba eso azonosítja. A 0 kódszavú esetben az összes sarokpont a testen kívül van, így a felület a voxelt nem metszheti. Hasonlóan, a 255 kódszavú esetben minden sarokpont a test belsejében található, ezért a felület ekkor sem mehet át a voxelen. A többi kódhoz pedig egy táblázatot építhetünk fel, amely leírja, hogy az adott konguráció esetén mely kockaélek végpont elojel  jai eltéro uek,  ezért metszéspont lesz rajtuk, valamint azt is, hogy a metszéspontokra miként kell háromszöghálót illeszteni.

628

15. Számítógépes graka

Gyakorlatok 15.3-1. Igazoljuk a két fül tételt teljes indukcióval. 15.3-2. Készítsünk adaptív görbetesszellációs algoritmust. 15.3-3. Bizonyítsuk be, hogy a Catmull–Clark felosztási módszer a B-spline görbéhez, illetve felülethez konvergál. 15.3-4. Készítsünk egy táblázatot a masírozó kockák algoritmus számára, amely minden  háromszögek számát, és azt, hogy a háromszögek csúcskódszóhoz megadja a keletkezo pontjai mely kockaélekre illeszkednek. 15.3-5. Készítsünk olyan masírozó kocka algoritmust, amely nem igényli az implicit függvény gradiensét a mintavételi pontokban, hanem azt is az implicit függvény mintáival becsli.

15.4. Tartalmazási algoritmusok A modellek feldolgozása során gyakran kell megválaszolnunk azt a kérdést, hogy egy alakzat tartalmazza-e egy másik alakzat valamely részét. Ha csak igen/nem válaszra vagyunk  is kell állítani a tartalmazott kíváncsiak, akkor tartalmazás vizsgálatról beszélünk. Ha elo alakzat azon részét, amely a másik alakzat belsejében van, akkor az algoritmuscsalád neve vágás. A tartalmazás vizsgálatot gyakran diszkrét ideju  ütközésfelismerésnek is nevezzük. Az   ütközéseket ugyanis közelítoleg vizsgálhatjuk úgy is, hogy csak diszkrét idopillanatokban nézünk rá a virtuális világ elemeire, és az ütközésekre utólag abból következtetünk, hogy megvizsgáljuk, tartalmazzák-e az alakzatok más alakzatok részeit. A diszkrét ideju  ütkö zésfelismerés hibázhat. Ha az objektumok sebessége a mintavételezési idohöz képest nagy,  akkor elofordulhat, hogy nem veszünk észre ütközéseket. Az ütközési feladat robusztus és  eljárások szükségesek, amelyek az pontos megoldásához folytonos ideju  ütközésfelismero  ütközés idopontját is kiszámítják. A folytonos ideju  ütközésfelismerést a sugárkövetésre (15.6. pont) építhetjük, így ebben a fejezetben csak a pont tartalmazással, a poliéderek közötti diszkrét ideju  ütközésfelismeréssel, és végül néhány egyszeru  alakzat vágásával foglalkozunk.

15.4.1. Pont tartalmazásának vizsgálata Az f implicit függvényu  test azon (x, y, z) pontokat tartalmazza, amelyekre az f (x, y, z)

≥0

 egyenlotlenség teljesül, így az adott pont koordinátáit az implicit függvénybe helyettesítve,  az eredmény elojele alapján dönthetünk a tartalmazásról. Féltér A féltér pontjait a (15.1) egyenlet alapján az (~ r

− ~r0 ) · ~n ≥ 0,

nx

· x + ny · y + nz · z + d ≥ 0

 egyenlotlenséggel adhatjuk meg, ahol a határoló sík normálvektora „befelé” mutat.

(15.9)

629

15.4. Tartalmazási algoritmusok

Konvex poliéder   síkok által határolt félterek metBármely konvex poliéder eloállítható a lapjaira illeszkedo  szeteként (15.22. ábra bal oldala). Minden lap síkja tehát a teret két részre bontja, egy belso  tartományra. Vessük össze a ponrészre, amelyikben maga a poliéder található, és egy külso tot a poliéder lapjaival, pontosabban azok síkjaival. Ha a pontunk minden sík tekintetében  részben van, akkor a pont a poliéderen belül van. Ha viszont valamely sík esetén a a belso  tartományban van, akkor a pont nem lehet a poliéder belsejében. külso

kívül belül

konvex poliéder

konkáv poliéder

1

2

pont belül kívül

kívül belül

15.22. ábra. Poliéder-pont tartalmazás vizsgálat. Konvex poliéder akkor tartalmaz egy pontot, ha a pont minden lapsíkjának ugyanazon az oldalán van, mint maga a test. Konkáv poliéderre egy félegyenest indítunk a pontból és megszámláljuk a metszéspontokat. Páratlan számú metszés esetén a pont belül van, páros számú metszéskor pedig kívül.

Konkáv poliéder A 15.22. ábra jobb oldalán látható módon indítsunk egy félegyenest a vizsgált pontból a végtelen felé, és próbáljuk elmetszeni a poliéder lapjait a félegyenessel (a metszéspontok számításához a 15.6. szakaszban a sugárkövetéshez kidolgozott eljárások használhatók). Ha páratlan számú metszéspontot számolunk össze, akkor a poliéder belsejében, egyébként pedig azon kívül van a pontunk. A numerikus pontatlanságok miatt a lapok találkozásánál gondot jelenthet annak eldöntése, hogy félegyenesünk itt hány lapot is metszett egyszerre. Ha ilyen helyzetbe kerülünk, akkor a legegyszerubb  egy olyan új félegyenest választani, amely elkerüli a lapok találkozását. Sokszög Természetesen a konkáv poliédereknél megismert eljárás a síkban is használható annak el  döntéséhez, hogy egy tetszoleges sokszög tartalmaz-e egy adott, ugyanebben a síkban lévo pontot. A síkon egy félegyenest indítunk a végtelen felé, és megszámláljuk a sokszög élei metszéspontokat. Ha a metszéspontok száma páratlan, akkor a pont a sokszög vel keletkezo belsejében, egyébként a külsejében van.  Ezen kívül a konvex lapoknál ellenorizhetjük, hogy a pontból a lap éleinek a látószögét összegezve 360 fokot kapunk-e, vagy megvizsgálhatjuk, hogy minden élre a pont ugyanazon az oldalon van-e, mint a lap többi csúcspontja. Az algoritmus muködését  részleteiben egy speciális esetre, a háromszögre tárgyaljuk.

630

15. Számítógépes graka

Háromszög

Tekintsünk egy háromszöget ~ a, ~ b és ~ c helyvektorú csúcsokkal, és egy, a háromszög síkjában  ~ lévo p pontot. A pont akkor van a háromszögön belül, ha a háromszög mind a három oldalegyeneséhez viszonyítva ugyanazon az oldalon van, mint a harmadik csúcs. A (~ b −~ a) × ( ~ p −~ a)

~ egyenes két oldalán lévo ~p pontokra ellentétes irányú, így ezen vektoriális szorzat az ab

~ vektor irányát felhasználhatjuk a pontok osztályozására (amennyiben a ~ p pont éppen az ab egyenesen lenne, a vektoriális szorzat eredménye zérus). A (~ b

− ~a) × ( ~p − ~a) vektor irányát = (~b − ~a) × (~c − ~a) vektor irányával kell összevetni, amelyben a vizsgált ~p pontot a háromszög harmadik ~ c csúcsával cseréltük fel. Vegyük észre, hogy ez az ~ n vektor éppen a tehát az ~ n

háromszög síkjának normálvektora (15.23. ábra). Két vektorról például úgy állapíthatjuk meg, hogy azonos irányúak (bezárt szögük nulla), vagy ellentétesek (bezárt szögük 180 fok), hogy képezzük a skaláris szorzatukat,  és megvizsgáljuk az eredmény elojelét. Azonos irányú vektorok skaláris szorzata pozitív, az

ellentétes irányúaké negatív. Tehát, ha a ((~ b −~ a) × ( ~ p −~ a)) · ~ n skaláris szorzat pozitív, akkor

~ egyenesnek ugyanazon az oldalán van, mint a ~c, ha negatív, akkor az ellentétes a ~ p az ab

~ egyenesre illeszkedik. A vizsgálatot mindhárom ololdalon, ha pedig zérus, akkor a ~ p az ab

dalegyenesre el kell végezni, és a ~ p pont akkor lesz a háromszög belsejében, ha mindhárom alábbi feltétel teljesül: ((~ b

0

((~ c

0

− ~a) × ( ~p − ~a)) · ~n ≥ − ~b) × ( ~p − ~b)) · ~n ≥ ((~ a −~ c) × ( ~ p −~ c)) · ~ n ≥

0

, , .

(15.10)

A vizsgálat robusztus, azaz akkor is helyes eredményt ad, ha a numerikus pontatlansá gok miatt a ~ p pont nincs pontosan a háromszög síkján, csak a síkra meroleges háromszög alapú hasábban.

( b- a ) x (p- a ) n b- a

a p- a

b

p a- c c

p- c ( a- c ) x ( p- c )

~ és bc ~  ~ 15.23. ábra. Háromszög-pont tartalmazás. Az ábra azt az esetet illusztrálja, amikor a síkon levo p pont az ab  balra, a ca  pedig jobbra helyezkedik el, azaz nincs bent a háromszög belsejében. ~ egyenestol egyenesektol

 Az egyenlotlenségrendszer kiértékelését gyorsíthatjuk, ha a háromdimenziós tér helyett annak kétdimenziós vetületén dolgozunk. Vetítsük le a vizsgált ~ p pontot, és vele együtt a háromszöget valamelyik koordinátasíkra, és ezen a síkon végezzük el a háromszög három ol-

631

15.4. Tartalmazási algoritmusok

dalára a tartalmazás vizsgálatot. A koordinátasík kiválasztásakor ügyelnünk kell arra, hogy a  legnagyobb legyen és semmi háromszög vetülete a numerikus pontosság érdekében a leheto esetre se zsugorodjon egy szakasszá. Ha a normálvektor három Descartes-koordinátája közül az nz a legnagyobb abszolút értéku,  akkor a legnagyobb vetület az xy síkon keletkezik. A  következokben csak ezzel az esettel foglalkozunk. Ha n x vagy ny lenne maximális abszolút  értéku,  akkor az yz, illetve az xz síkon a vizsgálat hasonlóan elvégezheto.

b c

vagy

a c

1.eset: ( bx - ax ) > 0

b

a b

a 2.eset: ( bx - ax ) < 0

vagy b

c

c

a

~ bal vagy jobb 15.24. ábra. Háromszög-pont tartalmazás vizsgálata az xy vetületen. A ~ c harmadik csúcs az ab oldalán helyezkedhet el, amit a csúcspontok sorrendjének felcserélésével mindig a baloldali esetre vezetünk vissza.

 Eloször átalakítjuk a csúcsok sorrendjét úgy, hogy ~ a-ból ~ b-be haladva a ~ c pont mindig

~ egyenes egyenletét:  a bal oldalon helyezkedjen el. Ehhez eloször vizsgáljuk meg az ab − ay · (x − b x ) + by = y . bx − ax by

c pont akkor van az egyenes bal oldalán, ha x A 15.24. ábra alapján a ~ egyenes felett van: by bx Mindkét oldalt (b x

=

c x -nél cy az

− ay · (c x − b x ) + by < cy . − ax

− a x )-szel szorozva: (by

− ay ) · (c x − b x ) < (cy − by ) · (b x − a x ) .

 A második esetben a meredekség nevezoje negatív. A ~ c pont akkor van az egyenes bal oldalán, ha x

= c x -nél cy az egyenes alatt van: by bx

A negatív (b x

− ay · (c x − b x ) + by > cy . − ax

 − a x ) nevezovel való szorzás miatt a relációs jel megfordul: (by

− ay ) · (c x − b x ) < (cy − by ) · (b x − a x ) ,

azaz mindkét esetben ugyanazt a feltételt kaptuk. Ha ez a feltétel nem teljesül, akkor ~ c nem

~ egyenes bal oldalán, hanem a jobb oldalán helyezkedik el. Ez pedig azt jelenti, hogy ~c az ab

~ egyenes bal oldalán található, tehát az ~a és ~b sorrendjének cseréjével biztosítható, hogy a ba

~ egyenes bal oldalán tartózkodjon. Fontos észrevenni, hogy ebbol  következik az is, ~c az ab

632

15. Számítógépes graka

~ egyenes, valamint a ~b a ca ~ egyenes bal oldalán helyezkedik el. hogy az ~ a a bc  Az algoritmus második lépésében pedig azt ellenorizzük, hogy a ~ p pont mindhárom oldalra a bal oldalon van-e, mert ekkor a háromszög tartalmazza a pontot, egyébként pedig nem:

− ay ) · ( p x − b x ) ≤ ( py − by ) · (b x − a x ) , − by ) · ( p x − c x ) ≤ ( py − cy ) · (c x − b x ) , (ay − cy ) · ( p x − a x ) ≤ ( py − ay ) · (a x − c x ) .

(by

(cy

(15.11)

15.4.2. Poliéder-poliéder ütközésvizsgálat Két poliéder ütközhet egymással úgy, hogy az egyikük egy csúcsa a másik egy lapjával találkozik, és ha semmi sem állítja meg, akkor a csúcs a másik test belsejébe hatol (15.25. ábra  Eloször  bal oldala). Ez az eset a korábban tárgyalt tartalmazás vizsgálattal felismerheto. az  poliéder összes csúcsára ellenorizzük,  elso hogy a másik poliéder tartalmazza-e, majd a két  poliéder belsejében poliéder szerepét felcserélve vizsgáljuk, hogy a második csúcsai az elso vannak-e.

csúcs behatolás

él behatolás

15.25. ábra. Poliéder-poliéder ütközésvizsgálat. Az ütközési esetek csupán egy részét ismerhetjük fel az egyik test csúcsainak a másik testtel való összevetésével. Ütközés keletkezhet úgy is, hogy csak az élek hatolnak a másik testbe, de a csúcsok nem.

 ütközésen kívül elofordulhat,  A csúccsal történo hogy két poliéder élei a másikba hatolnak anélkül, hogy csúcsaik a másik belsejébe kerülnének (15.25. ábra jobb oldala). Ennek felismeréséhez az egyik poliéder összes élét össze kell vetni a másik poliéder összes lapjá   val. Egy él és lap tekintetében a (15.9) egyenlotlenség felhasználásával eloször ellenorizzük, hogy az él két végpontja a lap síkjának két ellentétes oldalán van-e. Ha igen, akkor kiszámítjuk az él és a lap síkjának a metszéspontját, végül pedig eldöntjük, hogy a metszéspont a lapon belül van-e.   Vegyük észre, hogy az él behatolás és egy tetszoleges pont tartalmazásának ellenorzése együttesen magában foglalja a csúcs behatolás esetét is, tehát a csúcsok egyenkénti vizsgálata szükségtelennek látszik. Azonban csúcs behatolás nélküli él behatolás ritkábban  ráadásul a csúcs behatolását kevesebb számítással is felismerhetjük, így érdemes fordul elo,  eloször mégis a csúcs behatolást vizsgálni. A poliéderek ütközésvizsgálata során az egyik poliéder összes élét a másik poliéder összes lapjával össze kell vetni, amely négyzetes ideju  algoritmushoz vezet. Szerencsére  gyorsítható. Kea módszer a befoglaló keretek (15.6.2. pont) alkalmazásával jelentosen ressünk minden objektumhoz egy olyan egyszeru  alakzatot, amely tartalmazza azt. Különösen népszeruek  a befoglaló gömbök, illetve téglatestek. Ha a befoglaló alakzatok nem

633

15.4. Tartalmazási algoritmusok

találkoznak, akkor nyilván a befoglalt objektumok sem ütközhetnek. Amennyiben a befoglaló alakzatok egymásba hatolnak, akkor folytatni kell a vizsgálatot. Az egyik objektumot összevetjük a másik befoglaló alakzatával, és ha itt is ütközés mutatkozik, akkor magával az   és az ütközésvizsgáobjektummal. Remélhetoleg ezen utóbbi eset nagyon ritkán fordul elo,  részét a befoglaló alakzatokkal gyorsan el lehet intézni. latok dönto

15.4.3. Vágási algoritmusok A vágás egy vágó és egy vágandó alakzatot használ, és a vágandóból eltávolítja az összes olyan részt, amely a vágó külsejében van. A vágás megváltoztathatja a vágandó alakzat jellegét, így nehézséget okozhat, hogy a vágás után már nem lehet leírni olyan típusú függ vénnyel, mint a vágás elott. Ezért általában csak olyan vágó és vágandó alakzatokat engedünk meg, ahol a vágandó jellege (azaz a függvény típusa) a vágás után sem módosul. A továbbiakban feltételezzük, hogy a vágó alakzat féltér, általános, illetve speciális tulajdonságú poliéder, a vágandó pedig pont, szakasz, illetve sokszög.   o  pont algoritHa a vágandó alakzat egy pont, akkor a tartalmazást ellenorizzük az eloz  függoen  musaival, és annak eredményétol a pontot eltávolítjuk vagy megtartjuk. Szakaszok vágása féltérre Tekintsük az ~ r1 és ~ r2 végpontú ~ r (t)

= ~r1 · (1 − t) + ~r2 · t, (t ∈

[0, 1]) paraméteres egyenletu 

 származtatott szakaszt és a (15.1) egyenletbol (~ r

− ~r0 ) · ~n ≥ 0,

nx

· x + ny · y + nz · z + d ≥ 0

 egyenlotlenséggel adott félteret. Három esetet kell megkülönböztetni: 1.

 Ha a szakasz mindkét végpontja a féltér belsejében van, akkor a teljes szakasz belso pontokból áll, így megtartjuk.

2.

Ha a szakasz mindkét végpontja a féltér külsejében van, akkor a szakasz minden pontja  pont, így a vágás a teljes szakaszt eltávolítja. külso

3.

 pont, a másik végpontja belso  pont, akkor ki kell Ha a szakasz egyik végpontja külso  végpontot számítani a szakasz és a féltér határoló síkjának metszéspontját, és a külso fel kell cserélni a metszésponttal. A metszéspontot megkaphatjuk, ha a szakasz egyenletét a féltér határoló síkjának egyenletébe helyettesítjük, és az egyenletet az ismeretlen paraméterre megoldjuk: (~ r1

· (1 − ti ) + ~r2 · ti − ~r0 ) · ~n = 0, =⇒

ti

=

(~ r0 (~ r2

− ~r1 ) · ~n . − ~r1 ) · ~n

A ti paramétert a szakasz egyenletébe visszahelyettesítve a metszéspont koordinátáit is  eloállíthatjuk.

Sokszögek vágása féltérre  pontok-e A vágás során egyrészt az egyes csúcspontokat kell megvizsgálni, hogy azok belso  pont, akkor a vágott sokszögnek is egyben csúcspontja. vagy sem. Ha egy csúcspont belso  pont, nyugodtan eldobhatjuk. Másrészt vegyük észre, hogy Ha viszont a csúcspont külso

634

15. Számítógépes graka

az eredeti sokszög csúcsain kívül a vágott sokszögnek lehetnek új csúcspontjai is, amelyek az élek és a féltér határoló síkjának a metszéspontjai. Ilyen metszéspont akkor keletkezhet,  csúcs közül az egyik belso,  míg a másik külso  pont. A csúcsok ha két egymást követo  pont a határoló egyenkénti vizsgálata mellett tehát arra is gyelni kell, hogy a következo síkhoz viszonyítva ugyanazon az oldalon van-e (15.26. ábra).

p [3]

p[2]

vágósík

p[4]

q[2] q [3] p[1] q[1]

p [5] q [4] p[0] q[0]

15.26. ábra. A ~ p[0], . . . , ~ p[5] sokszög vágása, amelynek eredménye a ~ q[0], . . . , ~ q[4] sokszög. Az eredménysokszög  csúcsai és az éleknek a vágósíkkal képzett metszéspontjai. csúcsai az eredeti sokszög belso

 sokszögünk csúcsai a p = h~ Tegyük fel, hogy az eredeti egyszeresen összefüggo p[0], . . . , ~p[n − 1]i tömbben érkeznek, a vágott sokszög csúcsait pedig a q = h~q[0], . . . , ~q[m − 1]i tömbbe kell elhelyezni. A vágott sokszög csúcsainak számát az m változóban tároljuk. A  csúcs megvalósítás során kellemetlenséget okoz, hogy általában az i-edik csúcsot követo az (i

+

1)-edik, kivéve az utolsó, az (n



1)-edik csúcsot, amelyet a 0-adik követ. Ezt a

kellemetlenséget elháríthatjuk, ha a p tömböt kiegészítjük még egy ( ~ p[n]

= ~p[0]) elemmel,

amely még egyszer tárolja a 0-adik elemet. Ezek alapján a Sutherland–Hodgeman-poligonvágás: S–H- ´  ´ (p)

←0 ← 0 to n − 1  pont do if ~ p[i] belso then ~ q[m] ← ~ p[i] B Az i-edik csúcs része a vágott poligonnak. m ← m+1  pont if ~ p[i + 1] külso then ~ q[m] ← M p[i], ~ p[i + 1]) ´ - ´  ´ ´( ~ m ← m+1  pont else if ~ p[i + 1] belso then ~ q[m] ← M p[i], ~ p[i + 1]) ´ - ´  ´ ´( ~ m ← m+1

1

m

2

for i

3 4 5 6 7 8 9 10 11 12

return q Alkalmazzuk gondolatban ezt az algoritmust olyan konkáv sokszögre, amelynek a vá-

gás következtében több részre kellene esnie (15.27. ábra). A sokszöget egyetlen tömbben  részek elkülönítésére, és azokon a helyeken, nyilvántartó algoritmusunk képtelen a széteso

635

15.4. Tartalmazási algoritmusok

ahol valójában nem keletkezhet él, páros számú élt hoz létre.

páros számú határ

dupla határvonal  részeket páros számú élek tartják össze. 15.27. ábra. Konkáv sokszögek vágásakor a széteso

A páros számú extra él azonban nem okoz problémát a továbbiakban, ha a sokszög  pontjait a következo  elv alapján határozzuk meg: a kérdéses pontból egy félegyenest belso indítunk a végtelen felé és megvizsgáljuk, hogy hányszor metszi a sokszög éleit. Páratlan  pontjának tekintjük, páros számú metszámú metszéspont esetén a pontot a sokszög belso  pontnak. szés esetén külso  sokszögek vágására is alkalmazAz ismertetett algoritmus többszörösen összefüggo ható, csak ebben az esetben a bemutatott eljárást minden határoló zárt töröttvonalra különkülön kell végrehajtani. Szakaszok és poligonok vágása konvex poliéderre   síMiként korábban megállapítottuk, egy konvex poliéder eloállítható a lapjaira illeszkedo kok által határolt félterek metszeteként (15.22. ábra bal oldala), így a konvex poliéderre vá vágásra. Egy féltérre vágás kimenete a következo  gást visszavezethetjük félterekre történo  eredményt pedig az utolsó féltéren féltérre vágás bemeneti vágandó alakzata lesz, a végso végrehajtott vágáson is átjutó alakzat jelenti. Szakaszok vágása AABB-re A képszintézis algoritmusokban különösen fontos szerepet kap egy speciális típusú konvex poliéder, az AABB. 15.11. deníció. A koordinátatengelyekkel párhuzamos oldalú téglatesteket AABB-nek nevezzük. Egy AABB-t a minimális és maximális Descartes-koordinátáival adunk meg: [xmin , ymin , zmin , xmax , ymax , zmax ]. Bár az AABB-re vágáshoz használható lenne az általános konvex poliéderre kidolgozott  vágás, az AABB-k jelentosége miatt erre az esetre különlegesen gyors eljárást dolgoztak ki. Az AABB koordinátatengelyekkel párhuzamos oldalsíkjai a teret két részre bontják,  részre, amelyikben maga az AABB található, és egy külso  részre. A konvex poliegy belso éderre végrehajtott vágáshoz hasonlóan vessük össze a vizsgált pontot az AABB lapjaival,  részben van, akpontosabban azok síkjaival. Ha a pontunk minden sík tekintetében a belso  részben van, akkor a kor a pont az AABB-ben van, ha viszont valamely sík esetén a külso pont nem lehet az AABB belsejében. A szakasz AABB-re vágásához ezt az algoritmust mind a hat síkra végre kell hajtani,  így elofordulhat, hogy kiszámítunk olyan metszéspontot is, amelyet egy másik vágósík fe-

636

15. Számítógépes graka

leslegessé tesz. Érdemes tehát a síkok sorrendjét ügyesen megválasztani. Az egyik legegyszerubb  módszer a Cohen–Sutherland szakaszvágó algoritmus. Jelöljük 1-gyel, ha a pont nem a vágási tartomány félterében helyezkedik el, míg 0-val, ha az AABB-vel azonos féltérben található. Mivel 6 határoló sík létezik, 6 darab 0 vagy 1 értékünk lesz, amelyeket egymás mellé téve egy 6-bites kódot kapunk (15.28. ábra). Egy pont C[0], . . . , C[5] kódbitjei:

( C[0]

=

1,

x

0

egyébként.

( C[3]

=



xmin ,

1,

y

≥ ymax ,

0

egyébként.

( C[1]

=

x

0

egyébként.

( C[4]

=



(

1,

xmax ,

C[2]

= (

1,

z

≤ zmin ,

0

egyébként.

C[5]

=

101000 1001

1000

1,

y

0

egyébként

≤ ymin ,

1,

z

0

egyébként

.

≥ zmax , .

101000

1010 100010 000000

0001

0000

0010 000000

0101

0100

0110 010100

15.28. ábra. A sík pontjainak 4-bites és a tér pontjainak 6-bites kódjai. A szakasz vágásnál a koordinátasíkok sorrendjét a szakasz végpontjainak kódjai választják ki.

 pontok a vágási tartományban, a többiek Nyilvánvalóan a 000000 kóddal rendelkezo pedig azon kívül találhatók (15.28. ábra). Alkalmazzuk ezt a szakaszok vágására. Legyen  0, akkor mindkét végpont a szakasz két végpontjához tartozó kód C 1 és C 2 . Ha mindketto a vágási tartományon belül van, így a szakaszt nem kell vágni (triviális elfogadás). Ha a két kód ugyanazon a biten 1, akkor egyrészt egyik végpont sincs a vágási tartományban,   szakasz is ebben másrészt ugyanabban a „rossz” féltérben találhatók, így az oket összeköto a féltérben helyezkedik el. Ez pedig azt jelenti, hogy nincs a szakasznak olyan része, amely „belelógna” a vágási tartományba, így az ilyen szakaszokat a további feldolgozásból ki lehet zárni (triviális eldobás). Ezt a vizsgálatot legegyszerubben  úgy végezhetjük el, hogy a C 1 és C 2 kódokon végrehajtjuk a bitenkénti ÉS muveletet  (a C programozási nyelv jelöléseit alkalmazva C 1 & C 2 ), és ha az eredményül kapott kód nem nulla, akkor az azt jelenti, hogy a két kód ugyanazon a biten 1. Végül, ha egyik eset sem áll fenn, akkor kell lennie olyan bitnek, ahol az egyik kód 0, a másik pedig 1 értéku.  Ez azt jelenti, hogy van olyan vágósík, amelyre nézve az egyik  a másik pedig a külso  („rossz”) tartományban van, így a szakaszt erre a végpont a belso,  síkra vágni kell. A vágás után a metszéspont kódbitjeit kiértékeljük és a rossz oldalon lévo   kezdve addig isvégpontot a metszéspontra cseréljük. Az eljárást a feltételek ellenorzését ol  döntést mételjük, amíg triviális elfogadással” vagy triviális eldobással” nem tudunk végso ” ”

15.5. Mozgatás, torzítás, geometriai transzformációk

637

hozni. A Cohen–Sutherland szakaszvágó algoritmus a vágott szakasz végpontjait a paraméterként kapott végpontok módosításával adja meg, és visszatérési értéke akkor igaz, ha a vágás után a szakasz legalább részben a vágási tartomány belsejében van: C–S-- r1 ,~ r2 ) ´  ´ (~   ← az ~r1 végpont kódja B Kódbitek az egyenlotlenségek ellenorzésével. ← az ~r2 végpont kódja while  do if C 1 = 0 és C 2 = 0 then return  B Triviális elfogadás: van belso szakasz. if C 1 & C 2 , 0 then return  B Triviális eldobás: nincs belso szakasz.  f ← a legelso bit indexe, amelyen a C 1 és a C 2 különbözik ~ri ← az (~r1 , ~r2 ) szakasz és az f indexu sík metszéspontja C i ← az ~ ri metszéspont kódja if C 1 [ f ] = 1 then ~ r1 ← ~ ri C1 ← Ci B ~r1 van az f -edik sík rossz oldalán. else ~ r2 ← ~ ri C2 ← Ci B ~r2 van az f -edik sík rossz oldalán.

1

C1

2

C2

3 4 5 6 7 8 9 10 11 12 13 14 15

Gyakorlatok  15.4-1. Tegyünk javaslatokat a poliéder-poliéder ütközésfelismerés négyzetes idobonyolultságának csökkentésére. 15.4-2. Készítsünk CSG-fa adatszerkezethez pont tartalmazást vizsgáló algoritmust. 15.4-3. Készítsünk algoritmust, amely egy sokszöget egy másik, akár konkáv sokszögre vág. 15.4-4. Készítsünk algoritmust, amely egy poliéder befoglaló gömbjét, illetve befoglaló AABB-jét kiszámítja. 15.4-5. Adjunk algoritmust a síkban két háromszög ütközésének felismeréséhez. 15.4-6. Általánosítsuk a Cohen–Sutherland szakaszvágó módszert konvex poliéder vágási tartományra. 15.4-7. Dolgozzuk ki a szakaszt gömbre vágó módszert.

15.5. Mozgatás, torzítás, geometriai transzformációk  mozoghatnak, torzulhatnak, nohetnek,  A virtuális világ szereploi illetve összemehetnek,  azaz az eddig ismertetett egyenleteket elvileg minden idopillanatban újra fel kell venni.  függvény az eloz  o  alfejezet A gyakorlatban ehelyett két függvénnyel dolgozunk. Az elso módszerei szerint kiválasztja a tér azon pontjait, amelyek az adott objektumhoz tartoznak annak egy referenciahelyzetében. A második függvény pedig a referenciahelyzetben az ob jektumhoz tartozó pontokat leképezi az aktuális idopillanathoz tartozó pontokra. A teret

638

15. Számítógépes graka

 függvény a transzformáció. A mozgatást invertálható önmagára leképezo mációval írhatjuk le. Az ~ r kiindulási pont neve tárgypont, az ~ r Az invertálhatóság miatt minden transzformált ~ r  alakzatbeli osképét a

T

−1

0

0

= T (~r)

T (~r)

transzfor-

pedig a képpont.

ponthoz megkereshetjük annak eredeti

0

(~ r ) inverz transzformáció segítségével.

Ha az alakzatot a referenciahelyzetében az f implicit függvény deniálja, akkor a transzformált alakzat pontjainak halmaza

{~r 0

: f (T

−1

0

(~ r ))

≥ 0} ,

(15.12)

 hiszen a transzformált alakzat pontjainak osképei az eredeti alakzatban vannak. A paraméteres egyenletek közvetlenül az alakzat pontjainak Descartes-koordinátáit adják meg, így a ponthalmaz transzformációjához a paraméteres alakot kell transzformálni. Egy ~ r

= ~r(u, v) egyenletu felület transzformáltjának egyenlete tehát ~r 0 (u, v) = T (~r(u, v)) .

Hasonlóan egy ~ r

= ~r(t) egyenletu görbe transzformáltjának egyenlete: ~r 0 (t) = T (~r(t)) .

A

T

(15.13)

(15.14)

transzformáció általános esetben megváltoztathatja az alakzat és egyenletének a

  vagy egy gömbbol  bonyolult, torz jellegét. Könnyen elofordulhat, hogy egy háromszögbol alakzat keletkezik, ami csak ritkán kívánatos. Ezért a transzformációk körét érdemes szu  kíteni. Nagy jelentosége van például az olyan transzformációknak, amelyek síkot síkba, egyenest egyenesbe visznek át. Ehhez a csoporthoz tartoznak a homogén lineáris transz fejezetben foglalkozunk. formációk, amelyekkel a következo

15.5.1. Projektív geometria és homogén koordináták Idáig a virtuális világ felépítését az euklideszi geometria alapján tárgyaltuk, amely olyan fontos fogalmakat adott a kezünkbe, mint a távolság, a párhuzamosság, a szög stb. A transz bizonyos formációk mélyebb tárgyalása során azonban ezek a fogalmak érdektelenek, sot esetekben zavart is kelthetnek. A párhuzamosság például az egyenesek egy speciális viszonyát jelenti, amelyet külön kell kezelni akkor, ha egyenesek metszéspontjáról beszélünk. Ezért a transzformációk tárgyalásához az euklideszi geometria helyett egy erre alkalmasabb eszközt, a projektív geometriát hívjuk segítségül. A projektív geometria axiómái ügyesen kikerülik az euklideszi geometria párhuzamo sainak a problémáját azzal, hogy teljesen mellozik ezt a fogalmat, és kijelentik, hogy két  egyenesnek mindig van metszéspontja. Ennek érdekében a projektív geometriákülönbözo ban minden egyeneshez hozzáveszünk egy végtelen távoli” pontot, mégpedig úgy, hogy két ” egyeneshez akkor és csak akkor tartozzon ugyanaz a pont, ha a két egyenes párhuzamos. Az új pontot ideális pontnak nevezzük. A projektív tér az euklideszi tér pontjait (az úgynevezett közönséges pontokat) és az ideális pontokat tartalmazza. Az ideális pont az euklideszi egyenes

összeragasztja” ” végeit”, ezért topológiailag az egyenes a körhöz lesz hasonlatos. To-

” vábbra is érvényben szeretnénk tartani az euklideszi geometria azon axiómáját, hogy két

pont egy egyenest határoz meg. Annak érdekében, hogy ez két ideális pontra is igaz legyen,  az euklideszi sík egyeneseinek halmazát bovítjük az ideális pontokat tartalmazó, úgynevezett ideális egyenessel. Mivel két egyenes ideális pontja csak akkor egyezik meg, ha a

639

15.5. Mozgatás, torzítás, geometriai transzformációk

két egyenes párhuzamos, két sík ideális egyenese akkor és csak akkor azonos, ha a két sík párhuzamos. Az ideális egyenesek az ideális síkra illeszkednek, amelyet ugyancsak hozzáveszünk a tér síkjainak halmazához. Ezen döntések után nem kell különbséget tennünk az  a projektív tér ugyanolyan tagjai. euklideszi tér pontjai és az ideális pontok között, ok Az analitikus geometria bevezetésénél említettük, hogy a számítógépes grakában mindent számokkal kell leírni. Az idáig használt Descartes-koordináták egy-egy értelmu  kapcsolatban állnak az euklideszi tér pontjaival, így az ideális pontok jellemzésére alkalmatlanok. Az euklideszi geometria pontjait és az ideális pontokat egyaránt tartalmazó projektív sík és projektív tér jellemzésére tehát más algebrai alapra van szükségünk. Projektív sík  Eloször tekintsük a projektív síkot, amelynek pontjait szeretnénk számszerusíteni,  és vegyünk fel egy x, y koordinátarendszert ezen a síkon. Válasszunk az euklideszi térben egy Xh , Yh , h Descartes-koordinátarendszert úgy, hogy az Xh , Yh tengelyek az x, y tengelyekkel párhuzamosak legyenek, a sík koordinátarendszerének origója a tér (0, 0, 1) pontjában legyen, és a síkunk pontjaira a h

= 1 egyenlet teljesüljön. A vizsgált projektív síkot tehát beá-

gyaztuk egy háromdimenziós euklideszi térbe, amelynek pontjait Descartes-koordinátákkal  azonosításához pedig adjuk meg (15.29. ábra). A projektív sík pontjainak számokkal történo kapcsolatot teremtünk a beágyazó euklideszi tér pontjai és a projektív sík pontjai között. Ez a kapcsolat a projektív sík egy közönséges, vagy akár ideális P pontját a beágyazó euklide pontoknak felelteti meg, amelyet a beágyazó koordinátarendszer szi tér azon egyenesén lévo origója és a P pont meghatároz.  egyenes pontjait a [t Az origón átmeno

· Xh , t · Yh , t · h] paraméteres formában adhatjuk

meg a t paraméter függvényében. Amennyiben a P pont a sík közönséges pontja, az egyenes nem párhuzamos a h

=

1 síkkal (azaz h

,

0). Az egyenes az [Xh /h, Yh /h, 1] pontban

metszi a síkot, így a P pontnak a síkhoz rendelt Descartes-koordinátarendszerbeli koordinátái (Xh /h, Yh /h). Ha viszont a P pont ideális, az egyenes párhuzamos a h h

= 1 síkkal (azaz = 0). Az ideális pontok irányát ebben az esetben az (Xh , Yh ) vektor jelöli ki. [x.h, y .h, h] egyenes

h

[Xh ,Yh ,h] pont [x, y, 1] h=1 Xh Yh

[Xh ,Yh ,0] pont

15.29. ábra. A projektív sík beágyazott modellje: a projektív síkot a háromdimenziós euklideszi térbe ágyazzuk, és a projektív sík egy pontjának az euklideszi tér azon egyenesét feleltetjük meg, amelyet az origó és az adott pont meghatároz.

Ezzel az eljárással tehát a síknak mind a közönséges, mind pedig az ideális pontjaihoz [Xh , Yh , h] számhármasokat rendeltünk, amelyeket a síkbeli pont homogén koordinátáinak nevezünk. A homogén koordinátákat szögletes zárójelek közé tesszük, hogy a Descarteskoordinátáktól megkülönböztessük. A homogén koordináták bevezetésénél a projektív sík egy pontjának az euklideszi tér-

640

15. Számítógépes graka

 egyenesét feleltettünk meg, amelyet bármely, az origótól különbözo  nek az origón átmeno  következik, hogy mindhárom homogén koordináta nem lehet pontjával megadhatunk. Ebbol egyszerre zérus, és hogy a homogén koordináták egy nem zérus skalárral szabadon szoroz még a projektív sík ugyanazon pontját azonosítják. Ez a tulajdonság indokolja hatók, ettol a

homogén” elnevezést. ” A közönséges pontokat azonosító homogén koordinátahármasok közül gyakran cél-

 két hoszeru  azt kiválasztani, ahol a harmadik koordináta 1 értéku,  ugyanis ekkor az elso mogén koordináta a Descartes-koordinátákkal egyezik meg: Xh

= x,

Yh

= y,

h

=1.

(15.15)

Descartes-koordinátákat tehát úgy alakíthatunk homogén koordinátákká, hogy hozzájuk csapunk egy harmadik, 1 értéku  elemet. A beágyazott modell alapján könnyen felírhatjuk a projektív sík egyeneseinek és sza kaszainak homogén koordinátás egyenletét is. Vegyünk fel a projektív síkon két, különbözo   pontot, és adjuk meg oket a homogén koordinátáikkal. A különbözoség azt jelenti, hogy

, Yh1 , h1 ] hármasból egy skalárral való szorzással nem állítható elo az [Xh2 , Yh2 , h2 ] hár így mas. A síkot beágyazó térben az [Xh , Yh , h] hármas Descartes-koordinátának tekintheto, 1 1 1 2 2 2  egyenes egyenlete: az [X , Y , h ] és [X , Y , h ] pontokat összeköto h h h h az [X

1 h

Xh (t) Yh (t) h(t) Ha h(t)

,

= = =

1

· (1 − t) + Xh2 · t , 1 2 Yh · (1 − t) + Yh · t , 1 2 h · (1 − t) + h · t . Xh

(15.16)

 közönséges pontokat úgy kapjuk meg, hogy a há0, akkor projektív síkon lévo

romdimenziós tér pontjait a h

= 1 síkra vetítjük. A vetítés egyenest egyenesbe visz át, hiszen

 pontok megkövetelésével kizártuk azt az esetet, amikor a vetítés az egyenest a különbözo egyetlen pontra képezné le. Tehát az egyenlet valóban egy egyenes pontjait azonosítja. Ha viszont h(t)

= 0, akkor az egyenlet az egyenes ideális pontját fejezi ki.

 Ha t tetszoleges értéket felvehet, akkor az egyenes pontjait kapjuk. Ha viszont t értékét a [0, 1] intervallumra korlátozzuk, a két pont által kijelölt szakasz egyenletéhez jutunk. Projektív tér A projektív tér homogén koordinátáinak bevezetéséhez ugyanazt az utat követhetnénk, mint amit a síknál használtunk, de ehhez a háromdimenziós projektív teret a négydimenziós euklideszi térbe kellene beágyazni, ami kevésbé szemléletes. Ezért egy másik konstrukciót is  tárgyalunk, amely tetszoleges dimenzióban muködik.  A pontjainkat mechanikai rendszerek súlypontjaiként írjuk le. Egyetlen pont azonosításához egy ~ p1 referencia pontban Xh súlyt helyezünk el, egy ~ p2 referencia pontban Yh súlyt, egy ~ p3 pontban Zh súlyt és végül egy ~ p4 pontban w súlyt. A mechanikai rendszer súlypontja:

~r =

Xh

· ~p1 + Yh · ~p2 + Zh · ~p3 + w · ~p4 . Xh + Yh + Zh + w

Vezessük be az összsúly fogalmát a h

=

Xh

+ Yh + Zh + w egyenlettel. Deníciószeruen  az

[Xh , Yh , Zh , h] négyest a súlypont homogén koordinátáinak nevezzük. A homogén és a Descartes-koordináták közötti összefüggés felállításához a két koordinátarendszer viszonyát (a Descartes-koordinátarendszer bázisvektorainak, origójának és

641

15.5. Mozgatás, torzítás, geometriai transzformációk

a homogén koordinátarendszer referencia pontjainak kapcsolatát) rögzíteni kell. Tegyük fel például, hogy a referencia pontok a Descartes-koordinátarendszer (1,0,0), (0,1,0), (0,0,1) és (0,0,0) pontjaiban vannak. A mechanikai rendszerünk súlypontja (ha a h összsúly nem zérus) a Descartes-koordinátarendszerben:

~r[Xh , Yh , Zh , h] =

1 h

· (Xh · (1, 0, 0) + Yh · (0, 1, 0) + Zh · (0, 0, 1) + w · (0, 0, 0)) =

X

h

h

,

Yh h

,

Zh h

 .

Tehát az [Xh , Yh , Zh , h] homogén koordináták és az (x, y, z) Descartes-koordináták közötti összefüggés (h

, 0): =

x

Xh h

,

y

=

Yh h

,

z

=

Zh h

.

(15.17)

A projektív tér egyeneseinek és szakaszainak homogén koordinátás egyenletét akár a négydimenziós térbe ágyazott projektív tér modell felhasználásával, akár a súlypont analógia alapján is megkaphatjuk: Xh (t) Yh (t) Zh (t) h(t)

= = = =

1

· (1 − t) + Xh2 · t , 1 2 Yh · (1 − t) + Yh · t , 1 2 Zh · (1 − t) + Zh · t , 1 2 h · (1 − t) + h · t . Xh

(15.18)

Ha t értékét a [0, 1] intervallumra korlátozzuk, a két pont által kijelölt projektív szakasz egyenletéhez jutunk. A projektív sík egyenletének felírásához induljunk ki az euklideszi tér síkjának (15.1)  A sík pontjainak Descartes-koordinátái kielégítik az egyenletébol. nx

· x + ny · y + nz · z + d = 0

 Descartes és homogén koordináták köimplicit egyenletet. A (15.17) egyenletben szereplo zötti összefüggést behelyettesítve az egyenletbe továbbra is az euklideszi sík pontjait írjuk le: nx

·

Xh h

+ ny ·

Yh h

+ nz ·

Zh h

+d =0 .

Szorozzuk meg az egyenlet mindkét oldalát h-val, majd a h

= 0 koordinátájú, az egyenletet

 pontokat is adjuk síkhoz. Ezzel az euklideszi sík pontjait kiegészítettük az ideális kielégíto pontokkal, azaz a projektív síkhoz jutottunk. A projektív sík egyenlete tehát egy homogén lineáris egyenlet: nx vagy mátrixos alakban:

· Xh + ny · Yh + nz · Zh + d · h = 0 ,     [Xh , Yh , Zh , h] ·  

nx ny nz d

    = 0 .  

(15.19)

(15.20)

Figyeljük meg, hogy a tér pontjait négyelemu  sorvektorokkal, a síkjait pedig négyelemu  oszlopvektorokkal írhatjuk le. Mind a pontok négyesei, mind pedig a síkok négyesei homogén tulajdonságúak, azaz skalárral szabadon szorozhatók anélkül, hogy a homogén lineáris egyenlet megoldásai változnának.

642

15. Számítógépes graka

15.5.2. Homogén lineáris transzformációk Azokat a leképzéseket, ahol a képpont homogén koordinátáit a tárgypont homogén koordinátáinak és egy állandó 4

× 4-es

T transzformációs mátrixnak a szorzataként írhatjuk fel,

homogén lineáris transzformációknak nevezzük:

0

0

0

0

[Xh , Yh , Zh , h ]

= [Xh , Yh , Zh , h] · T .

(15.21)

15.12. tétel. A homogén lineáris transzformációk pontot pontba visznek át.

λ · [Xh , Yh , Zh , h]   a négyesekbol  a λ tetszoleges, nem zérus konstans. Ezekbol 0 0 0 0 transzformáció λ · [X , Y , Z , h ] = λ · [Xh , Yh , Zh , h] · T alakú négyeseket hoz létre, amelyek h h h ugyanazon négyes λ-szorosai, így az eredmény egyetlen pont homogén koordinátáit adja.

Bizonyítás. A transzformáció egy tárgypontját homogén koordinátákban alakban adhatjuk meg, ahol

Figyeljük meg, hogy a homogén tulajdonság miatt a homogén lineáris transzformációk csak egy skalárral való szorzás erejéig meghatározottak, azaz a transzformáció nem változik, ha a T mátrix minden elemét ugyanazzal a nem zérus skalárral szorozzuk. 15.13. tétel. Az invertálható homogén lineáris transzformációk egyenest egyenesbe visznek át.  Bizonyítás. Induljunk ki a tárgyegyenes paraméteres egyenletébol: [Xh (t), Yh (t), Zh (t), h(t)]

= [Xh1 , Yh1 , Zh1 , h1 ] · (1 − t) + [Xh2 , Yh2 , Zh2 , h2 ] · t,

t

= (−∞, ∞) ,

 a képalakzatot a tárgyalakzat pontjainak egyenkénti transzformálásával: és állítsuk elo

0

0

0

0

[Xh (t), Yh (t), Zh (t), h (t)]

= [Xh (t), Yh (t), Zh (t), h(t)] · T

= [Xh1 , Yh1 , Zh1 , h1 ] · T · (1 − t) + [Xh2 , Yh2 , Zh2 , h2 ] · T · t 0

0

] az [X

1 h

0

0

0

0

0

0

= [Xh1 , Yh1 , Zh1 , h1 ] · (1 − t) + [Xh2 , Yh2 , Zh2 , h2 ] · t , ahol [X

10 h

0

0

, Yh1 , Zh1 , h1

0

, Yh1 , Zh1 , h1 ]

pont, [X

20 h

0

0

, Yh2 , Zh2 , h2

0

] pedig az [X

2 h

, Yh2 , Zh2 , h2 ]

 A pont transzformáltja. A transzformáció invertálhatósága miatt a két pont különbözo. transzformált alakzat egyenlete éppen egy egyenes egyenlete, amely a két transzformált pontra illeszkedik.

Megjegyezzük, hogy ha nem kötöttük volna ki a transzformáció invertálhatóságát, ak  kor elofordulhatott volna, hogy a két tartópont képe ugyanaz a pont lenne, így az egyenesbol a transzformáció következtében egyetlen pont keletkezik. Ha a t paramétert a [0, 1] tartományra korlátozzuk, akkor a projektív szakasz egyenletét kapjuk, így kimondhatjuk, hogy a homogén lineáris transzformáció projektív szakaszt  általánosan is igaz, hogy a homogén lineáris transzformáprojektív szakaszba visz át. Sot  ciók konvex-kombinációkat konvex-kombinációkba visznek át, így például háromszögbol háromszög keletkezik. Ezzel a tétellel azonban nagyon óvatosan kell bánnunk akkor, ha az euklideszi geomet beszélünk. Vegyünk egy szakaszt. Ha a két végpont h ria szakaszairól és háromszögeirol

643

15.5. Mozgatás, torzítás, geometriai transzformációk

 elojel   projektív szakasz tartalmazza az ideális koordinátája eltéro u,  a pontokat összeköto  és a félegyenesek „végét” összekappontot is. Az ilyen szakasz intuitíve két félegyenesbol csoló ideális pontból áll, azaz a szokásos euklideszi szakasz fogalmunk kifordult változata.   Elofordulhat, hogy a transzformáció tárgyszakaszában a végpontok azonos elojel u  h koordinátákkal rendelkeznek, azaz a projektív szakasz megfelel az euklideszi geometria szakaszfogalmának, a transzformáció képszakaszának végpontjaiban viszont a h koordináták már  elojel  eltéro uek  lesznek. Így szemléletesen a transzformáció kifordítja a szakaszunkat. 15.14. tétel. Az invertálható homogén lineáris transzformációk síkot síkba visznek át. Bizonyítás. Az [Xh , Yh , Zh , h]

= [Xh0 , Yh0 , Zh0 , h0 ] · T−1 pontok – azaz az [Xh0 , Yh0 , Zh0 , h0 ] transz-

 formált pontok osképei – egy síkon vannak, ezért kielégítik az eredeti sík egyenletét:

    [Xh , Yh , Zh , h] ·  

nx ny nz d

      0 0 0 0 − 1  = [X , Y , Z , h ] · T ·  h h h    

nx ny nz d

    = 0 .  

A mátrixszorzás asszociativitása miatt a transzformált pontok kielégítik az

   0 0 0 0  [Xh , Yh , Zh , h ] ·  

0

nx

0

ny

0

nz d

0

    = 0 

egyenletet, amely ugyancsak egy sík egyenlete, ahol

     

0

nx

0

ny

0

nz d

0

       = T−1 ·    

nx ny nz d

    .  

Ezt az összefüggést felhasználhatjuk a transzformált sík normálvektorának számításához. A homogén lineáris transzformációk fontos speciális esetei az affin transzformációk, amelyekben a képpont Descartes-koordinátái a tárgypont Descartes-koordinátáinak lineáris függvényei: [x

0

, y0 , z0 ] = [x, y, z] · A + [ p x , py , pz ] ,

 ahol a különálló ~ p vektor az eltolásért felelos, az A pedig egy 3

(15.22)

×

3-as mátrix, amely a

 ezek tetszoleges  forgatást, a skálázást, a tükrözést stb., sot kombinációját is kifejezheti. Pél (t x , ty , tz ), (|(t x , ty , tz )| dául az origón átmeno

=

1) irányú tengely körül

φ

szöggel forgató

transzformációban

   A =  

− t2x ) cos φ + t2x ty t x (1 − cos φ) − tz sin φ tz t x (1 − cos φ) + ty sin φ (1

− cos φ) + tz sin φ 2 2 (1 − ty ) cos φ + ty tz ty (1 − cos φ) − t x sin φ t x ty (1

Ez az összefüggés Rodrigues-képlet néven ismeretes.

− cos φ) − ty sin φ t x tz (1 − cos φ) + t x sin φ 2 2 (1 − tz ) cos φ + tz t x tz (1

    .

644

15. Számítógépes graka

 és párhuzamos egyeneAz affin transzformációk nem vezetnek ki az euklideszi térbol, seket párhuzamos egyenesekbe visznek át. Az affin transzformációk egyben homogén lineáris transzformációk, hiszen a (15.22) egyenlet egy 4

× 4-es

mátrixmuvelettel  is leírható,

miután a Descartes-koordinátákról áttérünk homogén koordinátákra a negyedik homogén koordinátát 1-nek választva:

   0 0 0  [x , y , z , 1] = [x, y, z, 1] ·  

A11

A12

A13

0

A21

A22

A23

0

A31

A32

A33

0

px

py

pz

1

    = [x, y, z, 1] · T . 

(15.23)

Az affin transzformációk körén belül további speciális eset a távolságtartó transzformáció, amelyet egybevágósági transzformációnak nevezünk. Az egybevágósági transzformációk egyben szögtartóak is. 15.15. tétel. Az egybevágósági transzformációkban az A mátrix sorai egységvektorok és egymásra merolegesek.  Bizonyítás. Induljunk ki az egybevágósági transzformációk szög- és távolságtartó tulajdonságából, és alkalmazzuk ezt arra az esetre, amikor éppen az origót és a bázisvekto az rokat transzformáljuk. Az origóból a transzformáció a ( p x , py , pz ) pontot állítja elo, (1, 0, 0), (0, 1, 0) és (0, 0, 1) pontokból pedig rendre az (A11

+

p x , A12

+

py , A13

+

pz ),

(A21 + p x , A22 + py , A23 + pz ) és (A31 + p x , A32 + py , A33 + pz ) pontokat. A távolságtartás miatt transzformált pontok és az új origó távolsága továbbra is egységnyi, azaz | A11 , A12 , A13 | = 1, |A21 , A22 , A23 | = 1 és |A31 , A32 , A33 | = 1. Másrészt, a szögtartás miatt a bázisvektorok transz formáltjai, az (A11 , A12 , A13 ), (A21 , A22 , A23 ) és (A31 , A32 , A33 ) vektorok egymásra merolegesek.

Gyakorlatok 15.5-1. A Descartes-koordinátarendszer, mint algebrai alap felhasználásával igazoljuk az euklideszi geometria axiómáit, például, hogy két pontra egy egyenes illeszkedik, és hogy  egyenes legfeljebb egyetlen pontban metszi egymást. két különbözo 15.5-2. A homogén koordináták, mint algebrai alap felhasználásával igazoljuk a projektív  egyenes mindig egy pontban metszi egygeometria egy axiómáját, miszerint két különbözo mást. 15.5-3. Bizonyítsuk be a súlypont analógia alapján, hogy a homogén lineáris transzformációk egy háromdimenziós szakaszt szakaszba visznek át. 15.5-4. Hogyan változtatja meg egy affin transzformáció egy test térfogatát? 15.5-5. Írjuk fel a ~ p vektorral eltoló transzformáció mátrixát. 15.5-6. Igazoljuk a Rodrigues-képletet. 15.5-7. Egy f (~ r)



 0 egyenlotlenséggel leírt test ~ v sebességgel egyenletesen mozog. Írjuk

  fel a test pontjait leíró egyenlotlenséget a t idopillanatban.  15.5-8. Igazoljuk, hogy ha az A mátrix sorai egymásra meroleges egységvektorok, akkor az affin transzformáció egyben egybevágósági transzformáció is. Mutassuk meg, hogy ilyen

−1

mátrixokra A

= AT .

15.5-9. Írjuk fel azon homogén lineáris transzformáció mátrixát, amely a teret ~ c középponttal az ~ n normálvektorú, ~ r0 helyvektorú síkra vetíti.

645

15.6. Megjelenítés sugárkövetéssel

15.30. ábra. Képszintézis sugárkövetéssel.

15.5-10. Mutassuk meg, hogy 5 tárgypont-képpont pár egyértelmuen  azonosít egy homogén lineáris transzformációt, ha az 5 pont közül semelyik négy sincs egy síkon.

15.6. Megjelenítés sugárkövetéssel  A virtuális világ lefényképezéséhez azt kell meghatároznunk, hogy a virtuális meggyelo  irányokban milyen felületi pontokat lát. A lehetséges irányokat egy téglalap a különbözo  pixeleinek megfeleloen  alakú ablakkal jelölhetjük ki, amelyet a képernyo egy négyzetrácsra  képviseli a virtuális világban (19.12. ábra). Mivel a képbontunk fel. Az ablak a képernyot  pixeleit csak egyetlen színnel lehet kitölteni, elegendo  a négyzetrács négyzeteinek ernyo  pontokban) vizsgálnunk egy-egy pontjában (célszeruen  a pixel középpontoknak megfelelo a látható felületet. A szempozícióból egy irányban az a felület látható, amelyet a szempozícióból az adott irányban induló félegyenes – a sugár – a szempozícióhoz a legközelebb metsz. A sugár és a felületek legközelebbi metszéspontjának kiszámítását sugárkövetésnek nevezzük. A sugárkövetés nem csak a láthatóság eldöntésénél kap szerepet. Ha árnyékot kívánunk számítani, azaz arra vagyunk kíváncsiak, hogy a felületek egy pontot mely fényforrások  takarnak el, akkor a pontból a fényforrások irányába ugyancsak sugarakat küldünk és elol  elérnék a fényforeldöntjük, hogy ezek a sugarak metszenek-e valamilyen felületet mielott rásokat. A sugárkövetés szerepet kap a virtuális világ objektumai közötti ütközések felis pont azzal a felülettel merésénél is, ugyanis egy egyenes vonalú egyenletes mozgást végzo  ütközik, amelyet a pont pályáját leíró sugár eloször metsz.  egyenlettel adjuk meg: A sugarat a következo

~ ray(t)

= ~s + ~v · t,

(t

> 0) ,

(15.24)

  ahol ~ s a kezdopont helyvektora, ~ v a sugár iránya, a t sugárparaméter pedig a kezdoponttól való távolságot jellemzi. A továbbiakban azzal a feltételezéssel élünk, hogy ~ v egységvektor,

646

15. Számítógépes graka

4

mert ekkor t a tényleges távolságot jelenti, egyébként csak arányos volna a távolsággal . Ha t negatív, akkor a pont a szem mögött helyezkedik el, így nem jelent metszéspontot a félegyenessel (nem látható). A legközelebbi metszéspont megkeresése a legkisebb, pozitív   sugárparaméteru  metszéspont eloállítását jelenti. A legközelebbi metszéspont eloállításához  elvileg minden felülettel meg kell kísérelni a sugár és a felület metszéspontjának eloállítását,  metszéspontok közül a legközelebbit kell kiválasztani. Egy sugár és a ténylegesen létezo  algoritmus alkalmazható: legközelebbi metszéspontjának számításához a következo S s, ~ v) ´ -  - ´ (~

← tmax

B Inicializálás a tér legnagyobb méretére.

1

t

2

for minden o objektumra

3

if 0

5 6 7

←S - s, ~ v) B Negatív, ha nincs metszéspont. ´ - ¨ ´ (~ ≤ to < t B Az új metszéspont közelebbi-e? then t ← to B A legközelebbi metszés sugárparamétere. ometszett ← o B A legközelebb metszett objektum. t < tmax then B Volt egyáltalán metszéspont?  then ~ x ← ~ s +~ v·t B A metszéspont helye a sugár egyenletébol. return t, ~ x, ometszett else return nincs metszéspont” B Nincs metszéspont. do to

4

if

8 9 10

”

Az algoritmus a sugarat kapja bemeneti paraméteréül, és az ~ x változóban a metszéspont helyét, az ometszett változóban pedig a metszett objektumot adja meg. A harmadik visszaadott érték a metszésponthoz tartozó sugárparaméter. Az algoritmus az objektumonkénti S ´ -

 - ¨ ´  eljárást használja fel, amely az adott objektum és a sugár metszéspontjához tartozó sugárparamétert számítja ki, illetve negatív értékkel jelzi, ha a metszéspont nem létezne. A S - ´ - ¨ ´  algoritmust objektumtípusonként külön-külön kell megvalósítani.

15.6.1. Sugár-felület metszéspont számítás A sugár-felület metszéspont megkeresése lényegében egy egyenlet megoldását jelenti. A metszéspont a sugár és a vizsgált felület közös része, amit megkaphatunk, ha a sugár egyen egyenletet megoldjuk az ismeretletét behelyettesítjük a felület egyenletébe, és a keletkezo len sugárparaméterre. Implicit egyenletu  felületek metszése Az f (~ r)

= 0 implicit egyenletu felületeknél az

f (~ s +~ v

· t) = 0 skalár egyenletet kell megol-

dani. Tekintsük példaként a gömböt, ellipszist, hengert, kúpot, paraboloidot stb. magában foglaló másodrendu  felületek családját, amelyek implicit egyenlete egy kvadratikus alakkal

4

Az ütközésfelismerésnél ezzel szemben a ~ v nem egységvektor, hanem a mozgó pont sebességvektora, mert ekkor

a t sugárparaméter az ütközés idejét fejezi ki.

647

15.6. Megjelenítés sugárkövetéssel

adható meg:

ahol Q egy 4

    [x, y, z, 1] · Q ·  

x y z 1

    = 0 ,  

× 4-es mátrix. A sugár egyenletét a felület egyenletébe helyettesítve, az    s x + v x · t   sy + vy · t   =0, [s x + v x · t, sy + vy · t, sz + vz · t, 1] · Q ·   sz + vz · t  1

egyenletet kapjuk, amit átrendezve egy másodfokú egyenlethez jutunk: t ahol v

2

· (v · Q · vT ) + t · (s · Q · vT + v · Q · sT ) + (s · Q · sT ) = 0 ,

= [v x , vy , vz , 0] és s = [s x , sy , sz , 1].

A másodfokú egyenlet megoldóképletével a gyököket megkaphatjuk, amelyek közül most csak a pozitív, valós gyökök értelmesek. Ha két ilyen gyök is volna, akkor a kisebb felel meg a legközelebbi metszéspontnak. Paraméteres felületek metszése Az ~ r

= ~r(u, v)

paraméteres felület és a sugár metszéspontját úgy kereshetjük meg, hogy

 eloször az ismeretlen u, v, t paraméterekre megoldjuk az

~r(u, v) = ~s + t · ~v  háromváltozós, nemlineáris egyenletrendszert, majd ellenorizzük, hogy a kapott t pozitív-e, és az u, v paraméterek valóban a megengedett paramétertartomány belsejében vannak-e. A nemlineáris egyenletrendszer gyökeit általában numerikus módszerekkel állíthatjuk  vagy a felületeket háromszöghálóval közelítjük, majd ezt próbáljuk meg a sugárral elo, elmetszeni. Ha sikerül metszéspontot találni, az eredményt úgy lehet pontosítani, hogy a  paramétertartományban egy nomabb tesszellációt metszéspont környezetének megfelelo készítünk, és a metszéspontszámítást újra elvégezzük. Háromszög metszése

  A háromszögek metszéséhez eloször eloállítjuk a sugár és az ~ a, ~ b és ~ c csúcsú háromszög síkjának metszéspontját, majd eldöntjük, hogy a metszéspont a háromszögön belül van-e. A háromszög síkjának normálvektora ~ n

= (~b − ~a) × (~c − ~a), egy helyvektora pedig ~a, tehát a

 egyenletet: sík ~ r pontjai kielégítik a következo

~n · (~r − ~a) = 0 .

(15.25)

A sugár és a sík közös pontját megkaphatjuk, ha a sugár egyenletét ((15.24) egyenlet)  egyenletet megoldbehelyettesítjük a sík egyenletébe ((15.25) egyenlet), majd a keletkezo juk az ismeretlen t paraméterre. Ha a kapott t



érték pozitív, akkor visszahelyettesítjük a

 sugár egyenletébe, ha viszont negatív, akkor a metszéspont a sugár kezdopontja mögött he lyezkedik el, így nem érvényes. A sík metszése után azt kell ellenoriznünk, hogy a kapott ~ p pont vajon a háromszögön kívül vagy belül helyezkedik-e el. A tartalmazás eldöntéséhez a 15.4.1. pont algoritmusát használhatjuk fel.

648

15. Számítógépes graka

AABB metszése Egy AABB egy koordinátasíkokkal párhuzamos oldalú téglatest, amelynek felületét 6 tég o  pont algoritmusaira lalapra, illetve 12 háromszögre bonthatjuk fel, így a metszését az eloz vezethetjük vissza. Az általános sík-sugár metszés helyett azonban lényegesen hatékonyabb megoldáshoz juthatunk, ha felismerjük, hogy ebben a speciális esetben a számítások a há el. Egy AABB ugyanis az xmin rom koordinátára külön-külön végezhetok  lotlenséggel deniált x-réteg, az ymin zmin

≤ z ≤ zmax



y





x



xmax egyen-

 ymax egyenlotlenséggel deniált y-réteg, és a

 egyenlotlenséggel deniált z-réteg metszete. Tekintsük például az x-réteget,

amellyel a metszés sugárparaméterei: 1

tx

=

xmin

− sx

vx

,

2

tx

=

xmax

− sx

vx

.

 belépést, a másik pedig a kilépést azonoA két paraméter közül a kisebbik a rétegbe történo sítja. Jelöljük a belépés sugárparaméterét t

be

ki

-vel, a kilépését t -vel. A sugár tehát a [t

be

, tki ]

tartományban tartózkodik az x-réteg belsejében. Ugyanezt a számítást az y és z-rétegre is elvégezve három intervallumot kapunk. A sugár az intervallumok metszetében lesz az AABB belsejében. Ha a metszet t

ki

paramétere negatív, akkor az AABB a szempozíció mögött van,

így nincs metszéspont. Ha csak a t széspont pedig a t

ki

be

 indul, a metnegatív, akkor a sugár a doboz belsejébol

értéknél következik be. Végül ha t

hatol a dobozba, mégpedig a t

be

be

 is pozitív, akkor a sugár kívülrol

értéknél.

A felesleges metszéspontok számát a Cohen – Sutherland szakaszvágó algoritmus  (15.4.3 pont) alkalmazásával csökkenthetjük, amelyhez eloször a sugár félegyenesét egy  szakasszal váltjuk fel. A szakasz egyik pontja a sugár kezdopontja. A másik pontot pedig a 5

sugáregyenletnek a maximális sugárparaméter melletti értéke adja.

15.6.2. A metszéspontszámítás gyorsítási lehet®ségei  algoritmus egy sugarat minden objektummal összevet, és eldönti, Egy naiv sugárköveto  hogy van-e köztük metszéspont. Ha N objektum van a térben, a futási ido

Θ(N) mind átla-

gos, mind pedig legrosszabb esetben. A sugárkövetés tárigénye ugyancsak lineáris.  A módszer jelentosen gyorsítható lenne, ha az objektumok egy részére kapásból meg  tudnánk mondani, hogy az adott sugár biztosan nem metszheti oket (mert például azok a  sugár kezdopontja mögött, vagy nem a sugár irányában helyezkednek el), illetve miután találunk egy metszéspontot, akkor ki tudnánk zárni az objektumok egy másik körét azzal,  hogy ha a sugár metszi is oket, akkor azok biztosan ezen metszéspont mögött lesznek. Ilyen  döntésekhez ismernünk kell az objektumteret. A megismeréshez egy elofeldolgozási fázis szükséges, amelyben a metszéspontszámítás gyorsításához szükséges adatstruktúrát építjük  fel. Az elofeldolgozásnak természetesen ára van, amely akkor térül meg, ha utána nagyon sok sugarat kell követnünk. Befoglaló keretek A legegyszerubb  gyorsítási módszer a befoglaló keret alkalmazása. A befoglaló keret egy egyszeru  geometriájú objektum, tipikusan gömb vagy AABB, amely egy-egy bonyolultabb  objektumot teljes egészében tartalmaz. A sugárkövetés során eloször a befoglaló keretet próbáljuk a sugárral elmetszeni. Ha nincs metszéspont, akkor nyilván a befoglalt objek-

5

tmax

 = a kamerával együtt értendo színtér átméroje.

649

15.6. Megjelenítés sugárkövetéssel

tummal sem lehet metszéspont, így a bonyolultabb számítást megtakaríthatjuk. A befoglaló keretet úgy kell kiválasztani, hogy a sugárral alkotott metszéspontja könnyen kiszámítható  legyen, és kelloen szorosan körbe ölelje az objektumot.  idot  igényel. A befogA naiv sugárkövetés az objektumok számával lineárisan növekvo laló keretek alkalmazása után az algoritmus továbbra is lineáris. A lineáris tag együtthatója viszont várhatóan kisebb.  A befoglaló keretek azonban hierarchikus rendszerbe is szervezhetok, azaz a kisebb keretek magasabb szinteken nagyobb keretekbe foghatók össze. Ekkor a sugárkövetés során a befoglaló keretek által deniált hierarchiát járjuk be, ami szublineáris futási ideju  algoritmusokhoz vezethet. Az objektumtér szabályos felosztása Tegyünk az objektumtérre egy szabályos (c x , cy , cz ) cellaméretu,  a koordinátatengelyekkel párhuzamos oldalú rácsot (15.31. ábra), amit a teljes objektumteret befoglaló AABB felosztásával kapunk.

v

cx/vx

cy/vy

cy

(xmin ,ymin ,zmin )

cx

15.31. ábra. Az objektumtér szabályos felosztása. A sugárnak a rács egyes koordinátasíkjaival képzett metszéspontjai mindig c x /v x ,cy /vy , illetve cz /vz távolságra vannak.

  vagy a celAz elofeldolgozás során minden cellára határozzuk meg a cellában lévo, lába lógó objektumokat. Ehhez az egyes alakzat-cella párokra azt kell megvizsgálni, hogy a cella téglatestének és az alakzatnak van-e közös része. A vizsgálatot megoldhatjuk egy  vágási algoritmus (15.4.3. pont) futtatásával is, vagy pedig egyszeruen  úgy, hogy ellenorizzük, hogy az alakzat koordinátatengelyekkel párhuzamos oldalú befoglaló téglatestének és a cellának van-e közös része. Ez az egyszeru  módszer konzervatív, azaz akkor is belógónak  minosíthet egy alakzatot, ha maga nem, csak a befoglaló doboza hatol a cellába. Ez persze a sugárkövetésnél nem okoz hibát, legfeljebb felesleges metszési kísérleteket.

650

15. Számítógépes graka

S - ´ ´ - ´ ´ ´ () 1

számítsuk ki a rács minimális sarkát (xmin , ymin , zmin ) és cella méreteit (c x , cy , cz )

2

for minden c cellára

3

do c cella objektumlistája

4

← üres

for minden o objektumra

5

B A cellába lógó objektumok regisztrálása.

do if a c cella és az o objektum AABB-je egymásba lóg

6

then a c cella objektumlistájához hozzáadjuk az o objektumot

 A sugárkövetés fázisában a sugár által metszett cellákat a kezdoponttól való távolságuk sorrendjében látogatjuk meg. Egy cellánál csak azon objektumokat kell tesztelni, amelyek nek van közös része az adott cellával, azaz, amelyeket az elofeldolgozás során a cellában regisztráltunk. Másrészt, ha egy cellában az összes ide tartozó objektum tesztelése után megtaláljuk a legközelebbi metszéspontot, be is fejezhetjük a sugár követését, mert a többi  cellában esetlegesen eloforduló metszéspont biztosan a megtalált metszéspontunk mögött  van. A cellába lógó objektumok metszése után azt is ellenorizni kell, hogy a metszéspont is a cellában van-e, mert csak ilyen metszéspontokra jelenthetjük ki, hogy a további cellák    metszéspontjait megelozik. Elofordulhat, hogy egy objektummal egy késobbi cellában újból találkozunk. Sugár-felület metszéseket takaríthatunk meg, ha a korábbi számításokról nem feledkezünk meg, hanem a vizsgált objektumokhoz hozzárendeljük a korábbi metszésszámítás eredményét.  cella Amíg nincs metszéspont, a sugár által metszett cellákon megyünk végig. Az elso  X, Y, Z indexei a sugár ~ s kezdopontjából, az objektumokat befoglaló rács (xmin , ymin , zmin )  számíthatók ki: sarokpontjából és a cellák (c x , cy , cz ) méreteibol S - s) ´ ´ - ´ -(~ 1 2 3 4

← E´ ´ ((s x − xmin )/c x ) ← E´ ´ ((sy − ymin )/cy ) Z ← E ´  ´ ((sz − zmin )/cz ) return X, Y, Z X

Y

 Ez az algoritmus feltételezi, hogy a sugár kezdopontja is a rács által lefedett tartományban van. Ha ez a feltétel nem állna fenn, akkor ki kell számítani a sugár és a rácsot befoglaló  doboz metszéspontját, és oda áthelyezni a sugár kezdopontját. A koordinátánkénti t x , ty , tz sugárparaméterek kezdeti értéke a koordinátasíkokkal  metszéspont lesz, melynek koordinátáit a S képzett elso - ´ ´ ´ - ´

-´´  algoritmus határozza meg.  cellája egy 3D szakaszrajzoló algoritmus (3DDDA algoritA cellasorozat következo  Az algoritmus arra a felismerésre épít, hogy az x (és hamus) segítségével állítható elo.  sonlóképpen az y és a z) tengelyre meroleges síkok és a sugár metszéspontjaira érvényes sugárparaméterek mindig c x /v x távolságra (cy /vy , illetve cz /vz távolságra) vannak egymás metszésponthoz tartozó sugárparaméter egyetlen összeadással szától, tehát a következo  metszéspontot a t x , ty és tz globális mítható (15.31. ábra). Az x, y és z síkokkal keletkezo sugárparaméter változókban tartjuk nyilván, amelyeket mindig ugyanazzal az értékkel nö cella velünk. A három sugárparaméterérték közül mindig az jelöli ki a tényleges következo metszéspontot, amelyik a legkisebb.

651

15.6. Megjelenítés sugárkövetéssel

S - ´ --´´ (~s, ~v, X, Y, Z) ´ ´ - ´ 1

if v x

>0 ← (xmin + (X + 1) · c x − s x )/v x 0 B ~s a felezosík bal vagy jobb oldalán van? then (közeli, távoli) ← (cella.bal, cella.jobb) B Bal. else (közeli, távoli) ← (cella.jobb, cella.bal) B Jobb. if t > tki vagy t < 0 then cella ← közeli B Csak a közeli cellát metszi. else if t < tbe then cella ← távoli B Csak a távoli cellát metszi. else V(távoli, t, tki ) B Mindkét cellát metszi.  cella ← közeli B Eloször a közeli-t. tki ← t B A sugár t-nél lép ki a közeli cellából.

do koordináta d

B Ha az aktuális cella egy levél.

661

15.6. Megjelenítés sugárkövetéssel

← tki

B Maximális sugárparaméter a cellában.

21

t

22

for (a cella listájának o objektumaira)

←S - s, ~ v) B Negatív, ha nincs. ´ - ¨ ´ (~ ≤ to < t B Az új metszéspont közelebbi-e? then t ← to B A legközelebbi metszés sugárparamétere. ometszett ← o B A legközelebb metszett objektum. if t < tki B Volt metszéspont a cellában?  then ~ x ← ~ s +~ v·t B A metszéspont helye a sugár egyenletébol. return t, ~ x, ometszett B A metszéspontot megtaláltuk. return -1 B Nincs metszéspont.

23

do to

24

if tbe

25 26 27 28 29 30

tki t

tbe

bal

bal jobb

jobb

d

s

v

s

d>0

d tki

t

jobb

t 0 feltételt.

vetelményként megfogalmazzuk a h

így mindig pozitív. Tehát további köEkkor viszont szorozhatjuk a (15.32)

 egyenlotlenségeket h-val, így eljutunk a vágási tartomány homogén koordinátás leírásához:

−h≤

Xh

≤ h,

−h ≤ Yh ≤ h,

− h ≤ Zh ≤ h .

(15.33)

 A pontok vágása triviális feladat, hisz a homogén koordinátás alakjukra csak ellenorizni  kell, hogy teljesülnek-e a (15.33) egyenlotlenségek. A pontoknál összetettebb primitívekre (szakaszok, sokszögek stb.) azonban ki kell számítani a vágási tartomány határoló lapjaival való metszéspontokat, és a primitívnek pedig csak azt a részét kell meghagyni, amelynek  pontjai kielégítik a (15.33) egyenlotlenségeket. A Descartes-koordinátákkal dolgozó vágási algoritmusokkal a 15.4.3. pontban foglalkoztunk. Az ott megismert módszerek alkalmazhatók homogén koordinátákra is, azzal a   illetve jelölik ki, hogy egy pont belso, különbséggel, hogy most a (15.33) egyenlotlenségek  pontnak minosül-e,  külso valamint a szakaszoknak a vágósíkkal képzett metszéspontját a  kell számítani. szakasz és a sík homogén koordinátás egyenletébol

669

15.7. Az inkrementális képszintézis algoritmusai

, Yh1 , Zh1 , h1 ] és [Xh2 , Yh2 , Zh2 , h2 ] végpontú szakaszt, amely lehet önálló sokszög egyik éle, és az Xh ≤ h félteret (a többi féltérre a vizsgálat 1 h

Tekintsünk egy [X objektum, vagy egy

teljesen hasonló). Három esetet kell megkülönböztetni: 1.

1 h

 pont, azaz X Ha a szakasz mindkét végpontja belso



h

1

és X



2 h

2

h , akkor a teljes

 pontokból áll, így megtartjuk. szakasz belso 2.

 pont, azaz X Ha a szakasz mindkét végpontja külso

1 h

>

h

1

és X

2 h

>

2

h , akkor a szakasz

 pont, így a vágás a teljes szakaszt eltávolítja. minden pontja külso 3.

 pont, a másik végpontja belso  pont, akkor ki kell Ha a szakasz egyik végpontja külso  végpontot fel kell cserélni a számítani a szakasz és a vágósík metszéspontját, és a külso metszésponttal. Figyelembe véve, hogy a szakasz pontjai kielégítik a (15.19) egyenletet, a vágósík pontjai pedig kielégítik az Xh

=

h egyenletet, a metszéspont ti paraméterét a

 következoképpen határozhatjuk meg:

Xh (ti )

= h(ti ) =⇒

1

2

Xh · (1 − ti ) + Xh · ti

= h1 · (1 − ti ) + h2 · ti =⇒

ti

=

1 h

X X

1 h

− h1

− Xh2 + h2 − h1

A ti paramétert a szakasz egyenletébe visszahelyettesítve a metszéspont [X

i

h

, Yhi , Zhi , hi ]

 koordinátáit is eloállíthatjuk. A vágás során új szakasz végpontok és új sokszög csúcspontok keletkeznek. Ha az eredeti objektum csúcspontjai járulékos információkat is hordoznak (például a felület színét vagy normálvektorát ebben a pontban), akkor a járulékos információkat az új csúcsokra is át kell számítani. Ehhez egyszeru  lineáris interpolációt alkalmazhatunk. Ha a járulé1

2

 új kos információ értéke a két végpontban I , illetve I , akkor a vágás során keletkezo [Xh (ti ), Yh (ti ), Zh (ti ), h(ti )] pontban az értéke I

1

· (1 − ti ) + I 2 · ti .

15.7.5. A képerny®-transzformáció A perspektív transzformáció után a látható pontok koordinátái a [−1, 1] tartományban van lévo  megjelenítési ablak elhelyezkedésének és felbontásának, amelyeket még a képernyon   kép bal-alsó sarkát az (Xmin , Ymin ), a nak megfeleloen tolni és skálázni kell. Ha a keletkezo  sarkát az (Xmax , Ymax ) pixelen szeretnénk látni, a szemtol  való távolságot kifejezo  jobb-felso  Z koordinátákat pedig a (Zmin , Zmax ) tartományban várjuk, akkor a képernyo-transzformáció mátrixa:

Tkep

A

   =  

perspektív

(Xmax

− Xmin )/2 0

0 (Ymax

0 (Ymax

transzformáció

utáni

0

0

0

− Zmin )/2 (Zmax + Zmin )/2

1

− Ymin )/2 0

+ Xmin )/2

(Xmax

0

+ Ymin )/2

(Zmax

koordinátarendszerek,

így

0

    .   a

 képernyo-

koordinátarendszer is balsodrású, szemben a virtuális világ és a kamera koordinátarendszereinek jobbsodrású állásával. A balsodrású elrendezés felel meg ugyanis annak a  az X koordináták balról-jobbra, az Y koordináták természetes elvárásnak, hogy a képernyon  ol  távolodva nojenek.  alulról-felfelé, a Z koordináták pedig a meggyelot

670

15. Számítógépes graka

15.7.6. Raszterizációs algoritmusok   A vágás, a homogén osztás és a képernyo-transzformáció után az alakzataink a képernyokoordinátarendszerben vannak, ahol egy (X, Y, Z) pont vetületének koordinátái úgy határozhatók meg, hogy a koordinátahármasból csak az (X, Y ) párt ragadjuk ki. A raszterizáció során azokat a pixeleket azonosítjuk, amelyek átszínezésével a kép ernyo-koordinátarendszerbe transzformált geometriai alakzat formáját közelíthetjük. A raszterizációs algoritmusok kialakítása során a legfontosabb szempont az, hogy az algoritmus nagyon gyors legyen, és lépései egyszeru  hardverrel megvalósíthatók legyenek. Ezt a követelményt azzal magyarázhatjuk, hogy a folyamatos mozgás érzékeléséhez másodpercenként legalább 20 olyan képet kell kiszámítani, amelyek nagyságrendileg egymillió  állnak. Így az egyetlen pixelre jutó átlagos számítási ido  mindössze 50 nanosec pixelbol lehet. Szakaszok rajzolása  Jelöljük a vetített szakasz végpontjait (X1 , Y1 ), (X2 , Y2 )-vel. Tegyük fel továbbá, hogy midon  végpontból a második felé haladunk, mindkét koordináta no,  és a gyorsabban változó az elso irány az X, azaz

∆X =

X2

− X1 ≥ ∆Y = Y2 − Y1 ≥ 0.

 A többi eset a végpontok és az X, Y koordiEbben az esetben a szakasz enyhén emelkedo.  felcserélésével analóg módon kezelheto.  náták megfelelo  elvárás, hogy az átszínezett képA szakaszrajzoló algoritmusokkal szemben alapveto pontok között ne legyenek lyukak, és a keletkezett kép ne legyen vastagabb a feltétlenül  szakaszok esetén azt jelenti, hogy minden pixel oszszükségesnél. Ez az enyhén emelkedo lopban pontosan egy pixelt kell átszínezni, nyilván azt, amelynek középpontja a szakaszhoz a legközelebb van. Az egyenes egyenlete:

y

= m · X + b,

ahol

m

=

− Y1 , X2 − X1 Y2

és

b

= Y1 − X1 ·

− Y1 , X2 − X1 Y2

(15.34)

 alapján, az X koordinátájú oszlopban a legközelebbi pixel függoleges koordinátája az m · x + b   értékhez legközelebbi egész. A képlet minden pixel eloállításához lebegopontos szorzást,  összeadást és lebegopontos-egész átalakítást végez, ami megengedhetetlenül lassú.  módszere, amelyet inkrementális A gyorsítás alapja a számítógépes graka alapveto elvnek nevezünk. Ez azon a felismerésre épít, hogy általában könnyebben meghatározhatjuk az y(X

+ 1) értéket az y(X) felhasználásával, mint közvetlenül az

 Mivel egy enyhén X-bol.

 szakasz rajzolásakor az oszlopokat úgyis egymás után látogatjuk meg, az (X + 1)emelkedo dik oszlop feldolgozása során az y(X) már rendelkezésre áll. Egy szakasz esetén:

y(X

+ 1) = m · (X + 1) + b = m · X + b + m = y(X) + m ,

 ehhez egyetlen lebegopontos összeadás szükséges (m törtszám). Az elv gyakorlati alkalmazását digitális differenciális analizátor algoritmusnak (DDA-algoritmus) nevezik. A DDAelvu  szakaszrajzoló algoritmus:

671

15.7. Az inkrementális képszintézis algoritmusai

DDA- ´ (X1 , Y1 , X2 , Y2 , szín)

← (Y2 − Y1 )/(X2 − X1 ) ← Y1 for X ← X1 to X2 do Y ← K´(y) P-´ ´ (X, Y, szín) y ← y+m

1

m

2

y

3 4 5 6

 el xpontos számábrázolás segítségével. Ez azt jelenti, hogy További gyorsítás érheto T

a törtszám 2 -szeresét tároljuk egy egész változóban, ahol T a törtbitek száma. A törtbitek számát úgy kell megválasztani, hogy a leghosszabb ciklusban se halmozódhasson fel akkora hiba, hogy elrontsa a pixelkoordinátákat. Ha a leghosszabb szakasz hossza L, akkor   elféro  az ehhez szükséges bitek száma log2 L. A vágásnak köszönhetoen csak a képernyon  vízszintes, illetve függoleges  szakaszokat raszterizáljuk, így L a képernyo felbontásának  maximumával egyenlo. A DDA algoritmussal még mindig nem lehetünk teljes mértékben elégedettek. Egyrészt a szoftver implementáció során a xpontos ábrázolás és a kerekítés eltolási (shift) muvele teket igényel. Másrészt – igaz szakaszonként csupán egyszer – az m meredekség kiszámításához osztani kell. Mindkét problémával sikeresen birkózik meg a Bresenham-algoritmus.

1 t(X+1)

s(X+1)

Y

t(X)

t(X+1)

t(X)

s(X)

s(X+1)

s(X)

X 15.41. ábra. A Bresenham-algoritmus által használt jelölések. Az s a legközelebbi pixelközéppont és a szakasz  elojeles távolsága az Y tengely mentén, amely akkor pozitív, ha a szakasz a pixelközéppont felett van. A t a legközelebbi pixelközéppont feletti pixel és a szakasz távolsága az Y tengely mentén.

  Jelöljük a szakasz és a legközelebbi pixel középpont függoleges, elojeles távolságát s sel, a szakasz és a legközelebbi pixel feletti pixel függoleges távolságát t-vel (15.41. ábra).  oszlopra lépünk, az s és t értékei változnak. Nyilván az eredetileg legAhogy a következo

< t. = s − t hibaváltozót, addig nem kell megváltoztatnunk az átfestendo pixel < 0. Az s, t, e változók számításához az inkrementális elvet használhatjuk

közelebbi pixel sora és az eggyel feletti sor közül addig választjuk az alsó sort, amíg s Bevezetve az e sorát, amíg e

672 (∆ X

15. Számítógépes graka

=

X2

s(X

− X1 , ∆Y = Y2 − Y1 ):

+ 1) =

s(X)

+

∆Y , ∆X

t(X

+ 1) = t(X) −

Ezek az összefüggések akkor igazak, ha az (X

∆Y ∆X

=⇒

e(X

+ 1) = e(X) + 2

∆Y . ∆X

+ 1)-dik oszlopban ugyanazon sorokban lévo

 oben.   pixeleket tekintjük, mint a megeloz Elofordulhat azonban, hogy az új oszlopban már  pixel kerül közelebb a szakaszhoz (az e hibaváltozó pozitívvá válik), így az s, t, e a felso mennyiségeket ezen pixelre és az ezen pixel feletti pixelre kell meghatározni. Erre az esetre  képletek vonatkoznak: a következo

∆Y s(X + 1) = s(X) + − 1, ∆X

! ∆Y ∆Y t(X + 1) = t(X) − + 1 =⇒ e(X + 1) = e(X) + 2 −1 . ∆X ∆X

 Figyeljük meg, hogy az s elojeles távolságot jelent, azaz az s negatív, ha a szakasz az alsó pixelközéppont alatt található. Feltételezhetjük, hogy az algoritmus indulásakor egy pixel középpontban vagyunk, tehát:

s(X1 )

= 0,

t(X1 )

= 1 =⇒

e(X1 )

=

s(X1 )

− t(X1 ) = −1 .

 Az algoritmusnak az e hibaváltozót kell növelnie, és amikor az elojelet vált, a szakasz a  pixelsorra lép, mialatt a hibaváltozó ismét a negatív tartományba csúszik vissza. következo A hibaváltozó kezeléséhez nem egész összeadás szükséges, a növekmény meghatározása pedig osztást igényel.  Vegyük észre azonban, hogy a hibaváltozó elojelváltásait úgy is nyomon követhetjük, ha nem közvetlenül a hibaváltozóval, hanem annak valamely pozitív számszorosával dolgozunk. Használjuk a hibaváltozó helyett az E

= e · ∆X döntési változót. Enyhén emelkedo

 szakaszok esetén a döntési változó pontosan akkor vált elojelet, amikor a hibaváltozó. A döntési változóra érvényes képleteket a hibaváltozóra vonatkozó képletek

∆X-szel

 történo

szorzásával kapjuk meg:

     E(X + 1) =    

E(X)

+ 2∆Y ,

E(X)

+ 2(∆Y − ∆X), ha Y -t léptetni kell

A döntési változó kezdeti értéke pedig E

ha Y -t nem kell léptetni , .

= e(X1 ) · ∆X = −∆X.

 indul és minden lépésben egész számmal válA döntési változó egész kezdeti értékrol  tozik, tehát az algoritmus egyáltalán nem használ törteket. Ráadásul a növekmények eloállításához csupán egész összeadás (illetve kivonás), és 2-vel való szorzás szükséges. A teljes Bresenham-algoritmus:

673

15.7. Az inkrementális képszintézis algoritmusai

B- ´ (X1 , Y1 , X2 , Y2 , szín) 1 2 3 4 5 6 7 8 9 10 11

∆X ← X2 − X1 ∆Y ← Y2 − Y1 + − (dE , dE ) ← (2(∆Y − ∆ X), 2∆Y ) E ← −∆ X Y ← Y1 for X ← X1 to X2 do if E ≤ 0 − then E ← E + dE B Döntési változó nempozitív, maradunk a pixelsorban. +  pixelsorra lépünk. else E ← E + dE B Döntési változó pozitív, a következo Y ← Y +1 P-´ ´ (X, Y, szín)

A Bresenham-algoritmus bevezetésénél a tört hibaváltozót úgy váltottuk ki egy egész  változóval, hogy a kritikus egyenlotlenséget az összes változójával együtt egy pozitív szám mal szoroztuk, így az eredeti egyenlotlenséggel ekvivalens, de csak egészeket tartalmazó kifejezéshez jutottunk. Ezt a megközelítést invariánsok módszerének nevezik, és sok raszterizációs eljárásban hasznos segédeszköznek bizonyul. Poligonkitöltés Az

egyszeresen

 összefüggo

sokszögeket

 kitölto

algoritmus

bemenete

a

csúcsok

~q[0], . . . , ~q[m − 1] tömbje (ez a tömb általában a poligonvágó algoritmus kimenete), amelyben az e-edik él a ~ q[e] és ~ q[e + 1] csúcsokat köti össze. Az utolsó pont különleges kezelését  csúcsot még egyszer a vágásnál megismert módon most is megtakaríthatjuk, ha a legelso  sokszögeket egynél több zárt töröttbetesszük a tömb végére. A többszörösen összefüggo vonallal, azaz több csúcstömbbel adhatjuk meg.

Y

Y

q[1]

q[1] X0

X1 q[2]

X0 X3

X2 X1 q[3]

q[0] q[3]

q[0] X

q[2]

X

 pixeleket vízszintes pásztánként keressük meg. 15.42. ábra. Poligonkitöltés. A sokszög belsejében lévo

A kitöltést célszeruen  vízszintes pixelsoronként, azaz pásztánként végezzük. Egyetlen  pixelek a következoképpen  pásztára az átszínezendo határozhatók meg. Kiszámítjuk a poligon éleinek metszéspontjait a vízszintes pásztával. A metszéspontokat az X koordináta  és a második pont közötti, a alapján nagyság szerint rendezzük, majd átszínezzük a elso harmadik és a negyedik pont közötti, általában a (2i

+ 1)-edik és (2i + 2)-edik pont közötti

674

15. Számítógépes graka

pixeleket (15.42. ábra). Ez a módszer azokat a pontokat színezi ki, amelyeket ha végtelen távolból közelítünk meg, akkor páratlan számúszor kell átlépnünk a poligon határán.  meggyelésekkel A pászták és az élek metszéspontjainak kiszámítását a következo gyorsíthatjuk: 1.

Egy él és a pászta között csak akkor keletkezhet metszéspont, ha a pászta Y koordinátája az él minimális és maximális Y koordinátája között van, ezért csak ezekre érdemes a metszéspontot kiszámítani. Az ilyen éleket aktív éleknek nevezzük. Az implementációhoz létre kell hoznunk az aktív él listát, amely mindig csak az aktív éleket tartalmazza.

2.

 A két szakasz közötti metszéspontszámítás lebegopontos szorzást, osztást és összea dást tartalmaz, ezért idoigényes. Az inkrementális elv felhasználásával azonban a met o  pászta metszéspontjából egyetlen xpontos, nemszéspont meghatározható a megeloz egész összeadással (15.43. ábra).

Y+2 Y+1 Y

X ∆X/∆Y X(Y)

∆X/∆Y X(Y+1)

X(Y+2)

15.43. ábra. A pászta és az élek közötti metszéspont inkrementális számítása. Az X koordináta mindig az egyenes  meredekségének a reciprokával no.

Az inkrementális elv használatakor gyelembe kell vennünk, hogy az X koordináta nö Y egész értékekre állandó. Ha az él nagyobb Y koordinátájú vekménye az egymást követo végpontjának koordinátái (Xmax , Ymax ), a kisebb Y koordinátájú végpontjának koordinátái pedig (Xmin , Ymin ), akkor a növekmény

∆X/∆Y , ahol ∆X = Xmax − Xmin és ∆Y = Ymax − Ymin . ∆X/∆Y és az X érték tárolására xpontos

A növekmény általában nem egész szám, tehát a

tört ábrázolást kell használnunk. Egy aktív él reprezentációja tehát tartalmazza a xpontos ábrázolású

∆X/∆Y

növekményt, az ugyancsak xpontos ábrázolású X metszéspontot, vala-

 mint a szakasz maximális függoleges koordinátáját (Ymax ). Erre azért van szükségünk, hogy el tudjuk dönteni, hogy az Y pászták növelése során mikor fejezi be az él aktív pályafutását, azaz mikor kell eltávolítani az aktív él listából.

AET

Ymax ∆X/∆Y

X

Ymax ∆X/∆Y

X

15.44. ábra. Az aktív él lista szerkezete.

Az Y pásztákat egymás után töltjük ki. Minden pásztára megnézzük, hogy mely élek válnak pont ekkor aktívvá, azaz mely élek minimális Y koordinátája egyezik meg a pászta koordinátájával. Ezeket az éleket betesszük az aktív él listába. Egyúttal az aktív él listát átvizsgáljuk, hogy vannak-e ott nyugdíjba vonuló élek is, amelyek maximális Y koordinátája megegyezik a pászta koordinátájával. A nyugdíjba vonuló éleket kivesszük a listából (ve gyük észre, hogy ebben a megoldásban az él alsó végpontját az él részének tekintjük, a felso

675

15.7. Az inkrementális képszintézis algoritmusai

 gondoskodunk arról, hogy az aktív él listában az végpontját viszont nem). A kitöltés elott élek az X koordináta szerint rendezettek legyenek, majd minden második élpár közötti pixeleket átszínezzük. A kitöltés után az aktív él lista tagjaiban a metszéspontokat felkészítjük  pásztára, azaz minden él X tagjához hozzáadjuk az él a következo

∆X/∆Y

növekményét.

 a következo  pásztára. Majd kezdjük az egészet elölrol P ¨  ´ (poligon, szín) 1 2

for Y

← 0 to Ymax

do for a poligon összes él-ére

B Aktívvá váló élek az AET-be.

=Y then AET-R(él)

3

do if él.ymin

4

 B Az aktív létet befejezo élek törlése az AET-bol. ≤Y then AET  -T ¨  ¨ (él) AET-R B Rendezés X szerint. ´  (él1, él2) párra az AET-ben for minden második egymást követo do for X ← K´(él1.x) to K´(él2.x) do P-´ ´ (X, Y, szín) for minden él-re az AET-ben B Inkrementális elv. do él.x ← él.x + él.∆ X/∆Y

5

for minden él-re az AET-ben

6

do if él.ymax

7 8 9 10 11 11 12

Az algoritmus vízszintes pásztánként dolgozik, egy pászta feldolgozását az aktívvá váló élek (él.ymin

= Y ) aktív listába fuzésével  kezdi. Az aktív él listát három muvelet  kezeli. Az

 AET-R(él) muvelet  az él adatai alapján eloállítja az aktív él lista egy elemének az ada rekordot beteszi a listába. Az AET tait (Ymax , ∆ X/∆Y, X), és a keletkezo   -T ¨  ¨ muvelet egy listaelemet töröl a listából, amikor egy él éppen befejezi az aktív létet (él.ymax



Y ).

 alapján átrendezi a listát. A rendezés után az algoritmus minAz AET-R ´  az X mezo  él közötti pixelt kiszínez, és végül az inkrementális képletek den második él és a következo  pásztára lépteti. alkalmazásával az aktív él lista elemeit a következo

15.7.7. Inkrementális láthatósági algoritmusok  A láthatósági feladatot a képernyo-koordinátarendszerben oldjuk meg. Általában feltételezzük, hogy a felületeket sokszögháló formájában kapjuk meg. Z-buffer algoritmus A z-buffer algoritmus minden pixelre megkeresi azt a felületet, amelynél a pixelen keresztül látható pontban a Z koordináta minimális. A kereséshez minden pixelhez, a feldolgozás  adott pillanatának megfeleloen tároljuk az abban látható felületi pontok közül a legközelebbi Z koordinátáját. Ezt a Z értékeket tartalmazó tömböt nevezzük z-buffernek vagy mélységpuffernek.  A továbbiakban az egyszeruség,  valamint a gyakorlati jelentoség miatt feltételezzük,  áll. A háromszögeket egyenként dolgozzuk fel, és meghahogy a felület háromszögekbol tározzuk az összes olyan pixelt, amely a háromszög vetületén belül van. Ehhez egy három algoritmust kell végrehajtani. szögkitölto

676

15. Számítógépes graka

Amint a kitöltés során egy pixelhez érünk, kiszámítjuk a felületi pont Z koordinátáját  értékkel. Ha az ott található érték kisebb, akkor a és összehasonlítjuk a z-bufferben lévo már feldolgozott háromszögek között van olyan, amelyik az aktuális háromszöget ebben a pontban takarja, így az aktuális háromszög ezen pontját nem kell kirajzolni. Ha viszont a zbufferbeli érték nagyobb, akkor az idáig feldolgozott háromszögeket az aktuális háromszög takarja ebben a pontban, ezért az aktuális háromszög színét kell beírni a pixelbe és egyúttal a Z értékét a z-bufferbe. A z-buffer módszer algoritmusa tehát: Z--() 1

B Képernyo törlés.

for minden p pixelre do P-´ ´ ( p, háttér-szín)

2

z-buffer[ p]

3 4

← a legnagyobb ábrázolható érték B Rajzolás.

for minden o háromszögre

5

do for az o háromszög vetületének minden p pixelére

6

do Z

7

← az o háromszög p-re vetülo pontjának Z koordinátája < z-buffer[ p] then P-´ ´ ( p, az o színe ebben a pontban) z-buffer[ p] ← Z

if Z

8 9

 o  fejezet poligonkitölto  algoritmusát is, de célszerubb Alkalmazhatnánk az eloz  kihasz nálni a háromszög speciális tulajdonságaiból adódó elonyöket. Rendezzük a csúcsokat az   Y koordináták alapján és sorszámozzuk újra oket úgy, hogy az elsonek legyen a legkisebb és a harmadiknak a legnagyobb Y koordinátája, és gondolatban vágjuk ketté a háromszöget  háromaz Y2 pásztával. Ezzel két hasonló tulajdonságú háromszöget, egy alsó és egy felso  (baloldali) és a záró (jobboldali) él nem változik. szöget kapunk, amelyeken belül a kezdo  osztályozása attól függ, hogy az A háromszög éleinek jobb-, illetve baloldali élként történo  az (X3 , Y3 ) felé tartó irányított egyenes bal, vagy jobb (X2 , Y2 ) vetített csúcs az (X1 , Y1 )-bol oldalán van-e. Ha az (X2 , Y2 ) a bal oldalon található, a vetített háromszöget balállásúnak, egyébként pedig jobbállásúnak nevezzük. A csúcspontok Y koordináta szerinti rendezése,   az aka háromszög felvágása és az állás eldöntése után az általános poligonkitöltonkb ol tív él lista adminisztrációja kihagyható, csupán az inkrementális metszéspontszámítást kell megtartani. Az algoritmus részleteinek a bemutatása során feltesszük, hogy aktuálisan az

~r1 = [X1 , Y1 , Z1 ],

~r2 = [X2 , Y2 , Z2 ],

~r3 = [X3 , Y3 , Z3 ]

 kell csúcspontokkal deniált háromszöget dolgozzuk fel. A raszterizációs algoritmusnak elo  X, Y pixel címeket a Z koordinátákkal együtt (15.45. állítania a háromszög vetületébe eso ábra).  a megfelelo  Z koordinátát a háromszög síkjának az egyenletébol  Az X, Y pixel címbol számíthatjuk ((15.1) egyenlet), amely szerint a Z koordináta az X, Y koordináták lineáris függvénye. A háromszög síkjának az egyenlete: nX

· X + nY · Y + nZ · Z + d = 0,

ahol ~ n

= (~r2 −~r1 ) × (~r3 −~r1 )

és

d

= −~n ·~r1 .

(15.35)

 A háromszög balállású, illetve jobbállású voltát a normálvektor Z koordinátájának elojele

677

15.7. Az inkrementális képszintézis algoritmusai

Z(X,Y)

r3 =(X3 , Y3 , Z3 )

n

r1 =(X1 , Y1 , Z1 )

r2 =(X2 , Y2 , Z2 )

Y X,Y X   vetületébe eso  pixe15.45. ábra. Egy háromszög a képernyo-koordinátarendszerben. A háromszög XY síkon levo  pont Z koordinátáját a háromszög síkjának egyenletébol  számítjuk. leket látogatjuk meg. A pixeleknek megfelelo

alapján állapíthatjuk meg. Ha nZ negatív, a háromszög balállású, ha pozitív, akkor jobbál egyetlen szakasz lesz, így lású. Ha nZ zérus, akkor a vetítés következtében a háromszögbol a kitöltésére nincs szükség.  a Z(X, Y ) függvény: A háromszög síkjának az egyenletébol Z(X, Y )

=−

nX

· X + nY · Y + d nZ

.

(15.36)

  Az inkrementális elv felhasználásával ezen képlet jelentosen egyszerusíthet  o: Z(X

+ 1, Y ) = Z(X, Y ) −

nX nZ

= Z(X, Y ) + δZX .

(15.37)

(X3 ,Y3 ,Z3 )

Y Z = Z(X,Y) Z

X

(X2 ,Y2 ,Z2 ) δXs Y

δ ZX δXe Y δZ s Y

(X1 ,Y1 ,Z1 )

15.46. ábra. Inkrementális Z érték számítás egy balállású háromszögre.

Mivel a

δZX

paraméter állandó az egész háromszögre, csak egyszer kell kiszámítani.

Egyetlen pásztán belül a Z koordináta kiszámítása tehát egyetlen összeadást igényel. A ha tárvonalakat a poligonkitöltésnél megismert módon ugyancsak eloállíthatjuk az inkrementá a határvonal mentén a pászták kezdeti Z koordinátája is egyetlen lis elv felhasználásával, sot

678

15. Számítógépes graka

 o  pászta kezdeti Z koordinátájából (15.46. ábra). A telösszeadással kiszámítható a megeloz jes inkrementális algoritmus, amely egy balállású háromszög alsó felét tölti ki (a jobbállású  felet kitölto  algoritmus nagyon hasonló): eset, illetve a felso Z--  ´ - ´  ´ ¨ (X1 , Y1 , Z1 , X2 , Y2 , Z2 , X3 , Y3 , Z3 , szín) 1 2 3 4 5 6 7 8 9 10 11 12

~n ← ((X2 , Y2 , Z2 ) − (X1 , Y1 , Z1 )) × ((X3 , Y3 , Z3 ) − (X1 , Y1 , Z1 )) B Normálvektor.  δZX ← −nX /nZ B Z inkremens, ha X eggyel no. s s e (δ XY , δZY , δ XY ) ← ((X2 − X1 )/(Y2 − Y1 ), (Z2 − Z1 )/(Y2 − Y1 ), (X3 − X1 )/(Y3 − Y1 )) (Xbal , Xjobb , Zbal ) ← (X1 , X1 , Z1 ) for Y ← Y1 to Y2 do Z ← Zbal for X ← K´(Xbal ) to K´(Xjobb ) B Egy pászta rajzolása. if Z < z-buffer[X, Y ] B Takarás vizsgálat. then P-´ ´ (X, Y, szín) z-buffer[X, Y ] ← Z Z ← Z + δZX s s e B Következo pászta. (Xbal , Xjobb , Zbal ) ← (Xbal + δ XY , Xjobb + δ XY , Zbal + δZY )  pixelek azoA megismert algoritmus a háromszög kitöltés, azaz a háromszögben lévo

nosításával párhuzamosan lineárisan interpolálja a Z koordinátát. A lineáris interpolációhoz  Ugyanez a megoldás más háromszög tulajdonsápixelenként egyetlen összeadás elegendo.  gok esetén is alkalmazható. Például, ha ismerjük a háromszög csúcsainak színét, a belso pontokra folytonos színátmenetet valósíthatunk meg a szín lineáris interpolációjával [166]. Ha a számokat xpontosan ábrázoljuk, a lineáris interpolátor egyszeru  áramköri elemek felhasználásával hardverben is realizálható. A mai grakus kártyák ilyen egységekkel rendelkeznek. A z-buffer algoritmus a háromszögeket egyenként tölti ki, így

Θ(N ·

 igényel, P) idot

ahol N a háromszögek, P pedig a kép pixeleinek a száma. A gyakorlatban a helyzet ennél   így kedvezobb, mert a háromszögek száma általában a tesszelláció nomítása miatt no, ha több háromszögünk van, akkor méretük is kisebb, tehát kitöltésükhöz kevesebb pixel  így a háromszögek vetületei által lefedett pixelszámmal arányos, szükséges. A futási ido amely ekkor csak a felbontástól függ, azaz

Θ(P) típusú.

Warnock-algoritmus  felületelemek a képen összefüggo  pixeltartományon keresztül látszanak. Ezen A különbözo koherencia tulajdonság miatt célszeru  a láthatóságot a pixelnél nagyobb egységekre vizsgálni. A vetített poligonok és az ablak lehetséges viszonyai alapján, a 15.47. ábra szerint,  metszo  és tartalmazott poligonokat különböztethetünk meg. Ha szekülönálló, körülvevo,  poligonok vannak. A rencsénk van, akkor az objektumtérben csak különálló és körülvevo  sokkülönálló sokszögek nem látszhatnak, így ezekkel nem kell foglalkozni. A körülvevo szögek vetülete pedig az összes pixelt magában foglalja. Ha feltételezhetjük, hogy a sok poligonok közül csak egyetlen egy látható, szögek nem metszik egymást, akkor a körülvevo  sugár követésével választhatunk ki. amelyet például az ablak középpontján átmeno Az egyetlen sugár követésével megoldható szerencsés eset akkor áll fenn, amikor egyet len poligonél sem vetül az ablakra. Ezt úgy ellenorizhetjük, hogy a poligonélek vetületére

679

15.7. Az inkrementális képszintézis algoritmusai

poligon poligon ablak

ablak

(a)

(b)

poligon ablak

(c)

ablak poligon (d)

 (), metszo  (), tartalmazott (). 15.47. ábra. Poligon-ablak relációk: különálló (), körülvevo

alkalmazzuk a kétdimenziós szakaszvágó algoritmust (15.4.3. pont). Ha a vágás minden szakaszra úgy találja, hogy a szakasz teljes egészében eldobandó, akkor a sokszögek valóban  típusúak lehetnek. Ha viszont nem vagyunk ebben a szerencsés csak különálló és körülvevo helyzetben, akkor az ablakot négy egybevágó ablakra bontjuk fel, és újra megvizsgáljuk, hogy szerencsénk van-e vagy sem. Az eljárás, amelyet Warnock-algoritmusnak neveznek, rekurzívan ismételgeti ezt a lépést, amíg vagy sikerül visszavezetni a takarási feladatot a szerencsés esetre, vagy az ablak mérete a pixel méretére zsugorodik. A pixel méretu  ablaknál az újabb felosztások már értelmetlenné válnak, így erre a pixelre már a szokásos módon (például sugárkövetéssel) kell megoldanunk a takarási feladatot. A módszer algoritmusának  leírása során (X1 , Y1 )-gyel jelöljük az ablak bal-alsó sarkának és (X2 , Y2 )-vel a jobb-felso sarkának egész értéku  koordinátáit: W-(X1 , Y1 , X2 , Y2 ) 1 2

if X1

,

B Az ablak a pixelnél nagyobb? B Ablakfelezés és rekurzió. then W-(X1 , Y1 , (X1 + X2 )/2, (Y1 + Y2 )/2) W-(X1 , (Y1 + Y2 )/2, (X1 + X2 )/2, Y2 ) W-A((X1 + X2 )/2, Y1 , X2 , (Y1 + Y2 )/2) W-A((X1 + X2 )/2, (Y1 + Y2 )/2, X2 , Y2 )

X2 vagy Y1

, Y2

then if legalább egy él esik az ablakba

3 4 5 6 7

return

8

B Triviális eset: az (X1 , Y1 , X2 , Y2 ) téglalap homogén. poligon ← az ((X1 + X2 )/2, (Y1 + Y2 )/2) pixelben látható poligon

9

if nincs poligon

10

then (X1 , Y1 , X2 , Y2 ) téglalap kitöltése háttér színnel

11

else (X1 , Y1 , X2 , Y2 ) téglalap kitöltése a poligon színével

 algoritmus Festo  A festés során a késobbi ecsetvonások elfedik a korábbiakat. Ezen egyszeru  elv kiaknázásához rendezzük a poligonokat oly módon, hogy egy P poligon csak akkor állhat a sorrendben egy Q poligon után, ha nem takarja azt. Majd a poligonokat a kapott sorrendben visszafelé haladva egymás után raszterizáljuk. Ha egynél több poligon vetül egy pixelre, a pixel színe az utoljára rajzolt poligon színével egyezik meg. Mivel a rendezés miatt a korábban rajzoltak nem takarhatják az utolsó poligont, ezzel a festo  algoritmussal a takarási feladatot megoldottuk.

680

15. Számítógépes graka

 rendezése több problémát is felvet, ezért vizsgáljuk meg ezt a A poligonok megfelelo kérdést részletesebben. Azt mondjuk, hogy egy

P poligon nem takarja a Q poligont”, ha P”  nek semelyik pontja sem takarja Q valamely pontját. Ezen reláció teljesítéséhez a következo feltételek valamelyikét kell kielégíteni:

1.

a P poligon minden pontja hátrébb van (nagyobb Z koordinátájú) a Q poligon bármely pontjánál;

2.

a P poligon vetületét befoglaló téglalapnak és a Q poligon vetületét befoglaló téglalapnak nincs közös része;

3.

 mint a Q síkja; P valamennyi csúcsa (így minden pontja) messzebb van a szemtol,

4.

Q valamennyi csúcsa (így minden pontja) közelebb van a szemhez, mint a P síkja;

5.

a P és Q vetületeinek nincs közös része.

 A felsorolt feltételek bármelyike elégséges feltétel, amelyek ellenorzése a sorrendnek meg  feleloen egyre nehezebb, ezért az ellenorzéseket a fenti sorrendben végezzük el.  lépésként rendezzük a poligonokat a maximális Z koordinátájuk szerint úgy, hogy Elso a közeli poligonok a lista elején, a távoli poligonok pedig a lista végén foglaljanak helyet.  Ez önmagában még nem elég, hiszen elofordulhat, hogy az így kapott listában valahol borul a

”

P poligon nem takarja a Q poligont” reláció.  Ezért minden egyes poligont össze kell vetni valamennyi, a listában elotte álló poli-

  gonnal, és ellenorizni kell a megadott feltételeket. Ha azok valamelyike minden elobb álló  Ha viszont a poligonunk takar poligonra teljesül, akkor az adott poligon helye megfelelo.  egy elobb álló poligont, akkor a takart poligont az aktuális poligon mögé kell vinni a listá ban, és a mozgatott poligonra visszalépve újra kell kezdeni a feltételek ellenorzését.

Q P

R

Q1 P1 Q2

P2

P

Q 15.48. ábra. Ciklikus takarás, amelyet úgy oldhatunk fel, hogy az egyik sokszöget a másik síkjával kettévágunk.

 Elofordulhat, hogy ez az algoritmus végtelen ciklusba kerül. Például ha két poligon egymást kölcsönösen takarja (15.48. ábra bal oldala), az ismertetett algoritmus ezen két  esetet mutat be ugyanezen poligont vég nélkül cserélgetné. Még nehezebben felismerheto  ábra jobb oldala, amikor kettonél több poligon ciklikus takarásának lehetünk tanúi.  vágásával oldhatjuk fel, és ezáltal Ezeket a ciklikus átlapolásokat a poligonok megfelelo átsegíthetjük az algoritmusunkat a kritikus pontokon. A ciklikus átlapolások felismeréséhez  a mozgatáskor a poligonokat megjelöljük. Ha még egyszer mozgatni kell oket, akkor va hogy ennek oka a ciklikus átlapolás. Ekkor az újból mozgatott poligont a lószínusíthet  o, másik poligon síkja mentén két részre vágjuk.

681

15.7. Az inkrementális képszintézis algoritmusai

BSP-fa A BSP-fa egy bináris térpartícionáló fa, amely minden szinten a reprezentált térrészt egy alkalmas síkkal két részre bontja. A BSP-fa egy közeli rokona a 15.6.2. pontban megismert kd-fa, amely koordinátatengelyekkel párhuzamos elválasztó síkokat használ. Jelen fejezetünk BSP-fája azonban a háromszögek síkját választja elválasztó síkként. A fa csomópontjaiban sokszögeket találunk, amelyek síkja választja szét a két gyerek által deniált térrészt (15.49. ábra). A fa levelei vagy üresek, vagy egyetlen sokszöget tartalmaznak.  BSP-- A BSP-fát felépíto ´ ´ ´  algoritmus egy S sokszöglistát kap. Az algoritmusban a bináris fa egy csomópontját csomópont-tal, a csomóponthoz tartozó sokszöget csomópont.sokszög-gel, a csomópont két gyerekét pedig csomópont.bal-lal, illetve csomópont.jobb-bal jelöljük. Egy ~ r pontot az ~ n

· (~r − ~r0 )

 skaláris szorzat elojele alapján

sorolunk az ~ n normálvektorú és ~ r0 helyvektorú sík nem negatív (jobb) és negatív (bal) tartományába. BSP-- ´ ´ ´ (S ) 1

hozzunk létre egy új csomópont-ot

2

if S üres vagy egyetlen sokszöget tartalmaz

←S ← üres csomópont.jobb ← üres else csomópont.sokszög ← egy sokszög az S

3

then csomópont.sokszög

4

csomópont.bal

5 6

listából

7

távolítsuk el csomópont.sokszög-et az S listából

8

 a csomópont.sokszög síkjának nemnegatív félterébe lógók ← S -bol  a csomópont.sokszög síkjának negatív félterébe lógók ← S -bol + csomópont.jobb ← BSP-fa-felépítés(S ) − csomópont.bal ← BSP-fa-felépítés(S )

9 10 11 12

S

+

S



return csomópont

P3

P1

P1 P4 P2

P2

P3 P4

null

15.49. ábra. A BSP-fa. A térrészeket a tartalmazott sokszögek síkjai osztják fel.

A hatékonyság érdekében a BSP-fát úgy érdemes felépíteni, hogy mélysége minimális legyen. A BSP-fa mélysége függ az elválasztó síkot meghatározó sokszög kiválasztási stratégiájától, de ez a függés nagyon bonyolult, ezért heurisztikus szabályokat kell alkalmazni. A BSP-fa segítségével megoldhatjuk a takarási feladatot. A sokszögeket a fa bejárása során rajzoljuk fel. Minden csomópontnál eldöntjük, hogy a kamera a csomópont síkjának

682

15. Számítógépes graka

 melyik oldalán van. Eloször azon gyerek irányába lépünk, amely a kamera átellenes oldalán van, majd felrajzoljuk a csomópont saját sokszögét, végül pedig a kamera oldali gyereket dolgozzuk fel.

Gyakorlatok  válto15.7-1. Készítsük el a Bresenham-algoritmus teljes, mind a 8 síktartományt kezelo zatát.  eljárás minden pásztára minden élt megvizsgál, hogy az aktív él 15.7-2. A poligonkitölto  listába teheti-e oket. Módosítsuk az eljárást, hogy erre minden élre csak egyszer legyen szükség. 15.7-3. Készítsük el a z-buffer algoritmus teljes változatát, amely mind balállású, mind pedig jobbállású háromszögekre muködik.  15.7-4. Az átlátszó tárgyak színét egy egyszeru  modell szerint a tárgy saját színének és a mögöttes tárgy színének súlyozott átlagaként számíthatjuk. Mutassuk meg, hogy ekkor az  algoritmus és a BSP-fa ad helyes megismertetett takarási algoritmusok közül csak a festo oldást. 15.7-5. Az ismertetett Warnock-algoritmus akkor is felbontja az ablakot, ha arra egyetlen sokszög éle vetül. Javítsuk a módszert úgy, hogy ebben az esetben a poligont már újabb rekurziók nélkül felrajzolja. 15.7-6. Alkalmazzuk a BSP-fát diszkrét ideju  ütközésfelismeréshez.  eljárás térpartícionáló adatszerkezeteként. 15.7-7. Alkalmazzuk a BSP-fát a sugárköveto

Feladatok 15-1. Megjeleníto  rendszer sugárkövetéssel  rendszert a sugárkövetés algoritmusával. A testeket háromszögháKészítsünk megjeleníto   renlóval, illetve kvadratikus felületként adjuk meg, és diffúz fényvisszaverodési tényezot delünk hozzájuk. A virtuális térben pontszeru  fényforrásokat is felveszünk. Egy pont látható   színe arányos a diffúz fényvisszaverodési tényezovel, a fényforrás teljesítményével, a pontot  irány és a felületi normális közötti szög koszinuszával (Lamberta fényforrással összeköto féle koszinusz-törvény), és fordítottan arányos a pont és a fényforrás távolságával. A fényforrások láthatóságának eldöntéséhez ugyancsak a sugárkövetést használjuk. 15-2. Folytonos ideju  ütközésfelismerés sugárkövetéssel  algoritA sugárkövetés felhasználásával adjunk javaslatot egy folytonos ütközésfelismero musra, amely egy mozgó, forgó poliéderre és egy mozdulatlan síkra kiszámítja az ütközés  várható idejét. A megoldás során a poliéder csúcsainak mozgását kis dt idointervallumokban egyenesvonalú egyenletes mozgásnak tekintsük. 15-3. Megjeleníto  rendszer inkrementális képszintézissel  rendszert, amelyben a modellezési és Készítsünk teljes háromdimenziós megjeleníto  háromszögenként adjuk kamera-transzformációk beállíthatók. A virtuális világ szereploit meg, a csúcspontokhoz színinformációt is kapcsolva. A transzformációk és vágás után z pontok színének számításánál buffer algoritmussal oldjuk meg a takarási feladatot, a belso pedig a csúcspontok színét lineárisan interpoláljuk.

683

15. Megjegyzések a fejezethez

Megjegyzések a fejezethez  Hajós György [189] kiváló könyAz euklideszi, analitikus és projektív geometria elemeirol vében, a projektív geometriáról általában Maxwell [314, 315] és Coxeter [92] muveiben,  a számítógépes grakai alkalmazásáról pedig Herman Iván [204] és Krammer Gergely [266] cikkeiben olvashatunk. A görbék és felületek modellezésével a számítógépes geometriai tervezés (CAD, CAGD) foglalkozik, amelyet átfogóan Gerald Farin [125], valamint Ro történo  gers és Adams [395] tárgyalnak. A geometriai modellek mérési eredményekbol felépítése a mérnöki visszafejtés [481] területe. Az implicit felületek tanulmányozásához  leírása napBloomenthal muvét  [54] ajánljuk. A testeknek implicit egyenletekkel történo jainkban újabb reneszánszát éli a funkcionális-reprezentáció (F-Rep) alapú modellezés elterjedésével, amelynek részleteivel a http://cis.k.hosei.ac.jp/˜F-rep honlap foglalkozik. A   cseppmodellezésre eloször Blinn tett javaslatot [53]. Késobb az általa javasolt exponenciális függvényt kicserélték polinomfüggvényekre [502]. A polinomfüggvények, különösen a másodfokú alakok azért népszeruek,  mert ekkor a sugárkövetés során csak másodfokú egyenleteket kell megoldani. A geometriai algoritmusok a geometriai problémákra – mint a konvex burok létrehozása, metszés, tartalmazás vizsgálat, háromszögekre bontás, geometriai keresés stb. – adnak megoldást. A témakörrel az Új algoritmusok címu  könyv egy fejezete is foglalkozott, további információk Preparata és Shamos [376], valamint Marc de Berg muveiben  [101, 102]  sokszögek háromszögekre bontalálhatók. A egyszeru  vagy akár többszörösen összefüggo  tásához robusztus algoritmust adni annak ellenére meglepoen nehéz, hogy a témakör már  évtizedek óta fontos kutatási terület. A gyakorlatban használt algoritmusok O(n lg n) idoben futnak [102, 422, 506], bár Chazelle [74] egy optimális, lineáris ideju  algoritmus elvét is  származik [357]. A hákidolgozta. A két fül tétel idézett bizonyítása Joseph O'Rourke-tol  pillangó felosztást Dyn és társai [117] javasolták. A Sutherland– romszöghálókon muköd  o Hodgeman-poligonvágást a [442] cikk alapján mutattuk be. Az ütközésfelismerés a számítógépes játékok [450] egyik legkritikusabb algoritmusa.  a falakon átléphessenek, valamint ezzel Ez akadályozza meg ugyanis, hogy a szereplok dönthetjük el, hogy egy lövedék eltalált-e valamit a virtuális térben. Az ütközésfelismerési  sok algoritmusokat Jiménez, Thomas és Torras tekintik át [230]. A felosztott felületekrol  [70], Warren és Heimer hasznos információt kaphatunk Catmull és Clark eredeti cikkébol  [485], valamint Brian Sharp ismertetoib  ol  [429, 428]. A pillangófelosztást Dyn, könyvébol Gregory és Levin [117] javasolta. A sugárkövetés elveivel Glassner [154] könyvében ismerkedhetünk meg. A 3D sza kaszrajzoló algoritmust Fujimoto és társai [143] cikke alapján tárgyaljuk. A sugárköveto algoritmusok bonyolultságát számos publikációban vizsgálták. Bebizonyosodott, hogy N  objektumra a sugárkövetési feldatot O(lg N) idoben meg lehet oldani [101, 451], de ez csak elméleti eredmény, mert ehhez

Ω(N 4 )

  szükséges, és memóriaigény és elofeldolgozási ido

 a konstans szorzó is olyan nagy, hogy az eroforrásigény a gyakorlat számára elfogadhatatlan. A gyakorlatban inkább a fejezetben is tárgyalt heurisztikus módszereket alkalmazzák, amelyek a legrosszabb esetben ugyan nem, de várható értékben csökkentik a sugárkövetési feladat megoldási idejét. A heurisztikus módszereket Márton Gábor [339, 451] elemezte  javasolta a fejezetben is használt modellt. A heurisztivalószínuségi  módszerekkel, és o  kus algoritmusokról, elsosorban a kd-fa alapú módszer hatékony megvalósításáról Vlastimil Havran disszertációjában [196] olvashatunk, egy konkrét, optimalizált megvalósítás pedig

684

15. Számítógépes graka

Szécsi László cikkében [444] található. A virtuális világ valószínuségi  modelljében használt Poisson-pontfolyamat ismertetése megtalálható például Karlin és Taylor [240] és Lamperti [275] könyveiben. Az alkalmazott cellafelezési módszer Havrantól [196] származik. Az idézett integrálgeometriai tétel megtalálható Santaló[412] könyvében. A négyfa és az oktálisfa geoinformatikai alkalmazásait a könyv 16. fejezete tárgyalja. Az inkrementális képszintézis algoritmusaival Jim Blinn foglalkozik részletesen [53], C++ nyelvu  implementációt a [448] könyvben találhatunk, valamint más általános számítógépes graka könyvekhez is fordulhatunk [133, 450]. A láthatósági algoritmusok összehasonlító elemzését például a [443, 449] muvekben  találjuk meg. A Bresenham-algoritmus forrása [58]. Az inkrementális képszintézis algoritmusok, és azokon belül a z-buffer algoritmus, a valós-ideju  megjelenítés legnépszerubb  módszere, ezért a grakus kártyák ennek lépéseit valósítják meg, és az elterjedt grakus könyvtárak is (OpenGL, DirectX) erre a megközelítésre épülnek. A takarási feladatot megoldó festo  algoritmust Newell és társai [349] javasolták. A BSP-fa felépítésére Fuchs [142] javasolt heurisztikus szabályokat. A mai grakus hardver több szinten programozható, ezért a megjelenítési algorit arra is lehetoség  muslánc muködését  módosíthatjuk. Sot van, hogy a grakus hardveren nem grakus számításokat végezzünk el. A grakus hardver a nagyon nagyfokú párhu zamosságnak köszönhetoen óriási teljesítményu,  de a felépítése miatt csak speciális algoritmusok végrehajtására képes. Már megjelentek olyan, a grakus hardverre optimalizált algoritmusok, amelyek általános célú feladatokat oldanak meg (lineáris egyenletek, gyors Fourier-transzformáció, integrálegyenletek megoldása stb.). Ilyen algoritmusokról a http://www.gpgpu.org honlapon és Randoma Fernando könyvében [128] olvashatunk.

16. Térinformatika

A térinformatika (vagy geoinformatika) a térképészet és az informatika határán kialakult tudományterület. Ebben a fejezetben a legfontosabb térinformatikai fogalmakat és módszereket mutatjuk be: a 16.1. alfejezetben az adatmodellekkel, a 16.2. alfejezetben a térbeli indexeléssel, a 16.3. alfejezetben a digitális szurési  eljárásokkal, és végül a 16.4. alfejezetben a mintavételezéssel foglalkozunk.

16.1. A térinformatika adatmodelljei  digiA térinformatikában az adatok tekintélyes részét teszik ki a térbeliséget megtestesíto  tális térképek. Ezeknek alapvetoen két nagy csoportja van: az egyik csoportot a vektoros  a másik csoportot pedig a raszteres adatmodellt követo  térképek alkotadatmodellt követo,  ják. A kétféle térkép nagymértékben különbözik egymástól, mivel lényegesen különbözo adatmodellre épülnek. Az 16.1. ábrán a mintaterület egy nem térképszeru  ábrázolását látjuk, amelynek vektoros, majd a raszteres reprezentációját is ismertetjük.

16.1. ábra. A mintaterület madártávlatból.

686

16. Térinformatika

16.2. ábra. A mintaterület vektoros modellje.

16.1.1. A vektoros adatmodell A vektoros rendszerek helyvektorokkal írják le az objektumok térbeliségét megadó jellegzetes pontokat (és egy összekötési szabállyal mondják meg, hogy mely pontok alkotnak  poligont, vonalat vagy vonalláncot). A vektoros rendszerek nagy elonye, hogy nemcsak  komplex objektumok létrehozására alkalmasak, hanem a relációs hierarchikusan felépülo adatkapcsolatok kiépítése is viszonylag könnyen megvalósítható. A vektoros térképekhez kapcsolódnak az objektumokat leíró adatok, amelyek megjelenítése és elemzése a térinfor feladata. A vektoros adatok eroforrásigénye  matikai funkciókör egyik fo lényegesen kisebb,  mint a rasztereseké. A 16.2. ábrán az elobbi terület vektoros modellje látható.

16.1.2. A raszteres modell  területe. Adatainak forrása A raszteres rendszerek világa a térinformatika másik jelentos a digitális kép. A digitális kép elemi objektuma a pixel, azaz a legkisebb képpont, amit a képalkotó eszköz még képes létrehozni. A képalkotó eszköz nemcsak muhold  lehet, hanem  akár egy egyszeru  szkenner, vagy egy digitális fényképezogép. A pixel optikai állapota homogén, azaz színe, fényereje a pixelen belül állandó. A raszteres rendszerek a meggyelt felületet egy n

× m-es

mátrixra képezik le (n a sorok, m az oszlopok száma). A kép által

 ekkor a kép térképátfogott földterület alapján a pixelnek valós méret is megfeleltetheto, ként is használható. A 16.3. ábrán a mintaterület raszteres modelljét láthatjuk. A raszteres  térképek legnagyobb elonye a felszín rendkívül részlet-gazdag leírása. Hátrányuk a nagy  eroforrásigény, és a bonyolult objektumok felépítésének, valamint a relációs adatkapcsolatok létrehozásának nehézsége.

Gyakorlatok 16.1-1. Hasonlítsuk össze a vektoros és raszteres adatmodellt.

687

16.2. Térbeli indexelés

16.3. ábra. A mintaterület raszteres modellje.

16.2. Térbeli indexelés A digitális térképek kezelése – mind raszteres, mind a vektoros adatmodell esetében – álta lában nagy eroforrásigény u.  Az ilyen térképekkel dolgozó térinformatikai rendszerek alapja  rendszer, ami megoldja a térbeli objektumok tárolását, általában valamilyen adatbáziskezelo   minoség  kezelését, valamint lehetoséget biztosít interaktív használatra. A megfelelo biztosításához speciális módszerek állnak rendelkezésünkre, melyek támogatják a szintén speci objektumok lekérdezése ális muveleteinket  – mint amilyenek például az adott területre eso (tartomány-lekérdezések), adott koordinátát tartalmazó objektumok lekérdezése, legközelebbi szomszéd keresése, vagy a térbeli összekapcsolás.  A következokben a legfontosabb muveletre,  az adatbázis tartalmának megjelenítésére koncentrálunk. Megjelenítéskor megfeleltetést hozunk létre az adatbázis tartalma és a meg eszköz között (16.4. ábra). A szürke terület az adatbázisunk által lefedett síkrész jeleníto teljes kiterjedését mutatja, míg a fehér terület az úgynevezett viewport, amely a megtekinteni kívánt területet jelzi. A megjelenítés legegyszerubb  módja lenne beolvasni az egész adatrendszert a memóriába, és onnan végezni a kirajzolást. Ez az eljárás több szempontból  Egyrészt minek beolvasni olyan területek adatait, amik kívül esnek a viewsem követendo. porton, másrészt a memória mérete sem korlátlan, és célszeru  csak a látni kívánt terület adatait betölteni. Bonyolítja a helyzetet, hogy a háttértár (lemez) lényegesen lassabb muködés  u,  mint a memória, valamint hogy a háttértár adatait hatékonysági okokból nagyobb egységekben, úgynevezett blokkokban kezelhetjük. Egy elemi olvasási vagy írási muvelet  tehát egy  blokk olvasását vagy írását jelenti, a muvelet  sebessége pedig alapvetoen az érintett blok segítséget nyújt az eloz  oekben  kok számától függ. A térképi adatok indexelése megfelelo felvázolt keresési problémák megoldásához. Az indexelés során olyan adatstruktúrákat ho objektumok zunk létre, melyek segítségével adott tulajdonságú (például a viewportba eso)  anélkül, hogy az összes objektum térbeli elhelyezkedését meg hatékonyan visszanyerhetok kellene vizsgálnunk.  objektumok gyors megjelenítéséhez tehát ki kell tudnunk zárni a A viewportba eso  a viewporton kívüli területeket. Sajnos, a hagyományos adatbázis-kezelokben  keresésbol megszokott indexelési technikák – mint az általánosan használt B-fa – térbeli indexelésre

688

16. Térinformatika

16.4. ábra. A viewport és az adatbázis térbeli kiterjedésének viszonya.

16.5. ábra. Konvex és konkáv poligonok centroidjai.

nem alkalmasak, mivel csak az egy dimenzió (attribútum) szerinti lekérdezéseket támogat ják hatékonyan. Ezzel szemben a térinformatikai adatok lekérdezései jellemzoen két vagy három dimenzió, azaz két vagy három koordináta szerinti kereséseknek felelnek meg.  Még mielott rátérnénk néhány térbeli indexelési algoritmus bemutatására, ismerkedjünk meg a centroid és a befoglaló téglalap fogalmával. A centroid egy olyan pont, amely a poligon belsejében van, és alkalmas a poligon térbeli elhelyezkedésének ábrázolására. Kon deníciója a poligon súlypontja, míg konkáv vex poligonok esetében a centroid kézenfekvo  belso  pont (konkrét deníciója többféleképp is lehetséesetben egy súlyvonalra illeszkedo ges és elterjedt) (16.5. ábra). A befoglaló téglalap (MBR) az a legkisebb területu  téglalap, melynek oldalai párhuzamosak a koordináta-tengelyekkel, valamint teljes egészében tartalmazza a kérdéses objektumot (16.6. ábra). A befoglaló téglalap ábrázolásához mindössze  csúcsok használata általánosnak mondható. két pont szükséges, a bal alsó és jobb felso  A következokben feltesszük, hogy az adatbázisban síkbeli objektumokat tárolunk – a  vektoros adatmodellnek megfeleloen. Az objektumok lehetnek nulladimenziósak, vagyis egy darab ponttal reprezentáltak, lehetnek egydimenziósak, mint például utak, folyók vagy általában a vonalláncok, vagy kétdimenziósak, például poligonok. A fent bevezetett két fogalom a poligonok, vonalláncok, valamint általában síkbeli objektumok helyettesítésére  való. Azért használjuk oket, mert a térbeli indexeléskor ezen egyszeru  objektumokkal repre zentáljuk az idonként rendkívüli összetettségu  térbeli objektumokat.

689

16.2. Térbeli indexelés

objektum

befoglaló téglalap 16.6. ábra. A befoglaló téglalap.

1

2

3

.

.

.

B

A

D C

.

E

.

.

40

F  méretu 16.7. ábra. Különbözo  objektumok egy adott rácsállandójú négyzethálón.

A térbeli adatok indexelési módszerei vagy a térbeli objektumokat, vagy pedig a vizs gált térrészt osztják fel részekre. A következokben bemutatott módszerek a második kategóriába sorolhatók, tehát a tér valamely felosztásával próbálják gyorsítani az objektumok elérését.

16.2.1. Grid index Illesszünk a síkbeli objektumainkat tartalmazó síkrészre egy szabályos négyzethálót, ahogy a 16.7. ábrán látható. A síkrészen a négyzetháló segítségével kijelölt felosztás azonos mé négyzeteit nevezzük a továbbiakban celláknak, magát a négyzetretu,  egymást nem átfedo  relációt pedig grid indexnek. hálót gridnek, az objektumokat a felosztás celláihoz rendelo Az indexelés során tároljuk, hogy az egyes síkbeli objektumok melyik cellába esnek.  fontosságú muAz objektumok koordináták szerinti gyors keresésének – mint alapveto   lépése az úgynevezett elso  szurés, veletnek – elso  amikor jelölteket állítunk a lekérdezés  objektumok halmazára. Az index objektum azonosítói segítségével befeltételeit kielégíto olvassuk ezt a jelölthalmazt, ami a teljes adatbázisnál várhatóan jóval kevesebb objektumot  tartalmaz. A jelöltállításhoz felhasználjuk, hogy a koordinátákra vonatkozó feltételekbol  cellák, valamint hogy a grid index a cella azonogyorsan meghatározhatók a szóba jöheto  formában tárolható. A grid index gyors sítója szerint rendezett, ezáltal gyorsan keresheto

690

16. Térinformatika

cella azonosító

7 22 34 34

objektum azonosító

objektum azonosító

B C F E

A B C D E F

egyéb attribútumok

. ..

. ..

. ..

. ..

 tartalmazó tábla. 16.8. ábra. Az index tábla és az objektumok jellemzoit

kereséséhez felhasználhatunk a cella azonosítójára vonatkozó hagyományos adatbázis indexeket is. Második lépésben egy második szuréssel  dolgozzuk fel az így megtalált objektumok részletes geometriáját (például poligonok esetén a csúcsok koordinátáinak beolvasása  itt történik), és ellenorizzük a keresési feltételek teljesülését. A 16.8. ábra az index tábla felépítését szemlélteti a 16.7. ábra példáján keresztül. Az egyszeruség  kedvéért csak azokkal az objektumokkal foglalkozunk, melyek csak egy cellához tartoznak, így elkerülve az objektum reprezentálásának problémáját. A grid index táblája a cella azonosítója alapján, az  objektumokat tartalmazó tábla pedig az objektum azonosítója alapján gyorsan keresheto.  szurés Ennél fogva az objektumok koordináták szerinti keresései során az elso  gyorsan végrehajtható, valamint a második szuréshez  szükséges jelöltek – várhatóan jóval kisebb  az objektumok táblájában. Ezzel szemben egy számosságú – halmaza is gyorsan elérheto hasonló keresés az index tábla használata nélkül az objektumokat tartalmazó tábla teljes végigolvasását igényli, mivel a koordinátákra tett feltételek teljesülése csak az objektumok  attribútumainak egyenkénti feldolgozásával döntheto  el. megfelelo  a cellák mérete nem mindig van összhangban az Amint a 16.7. ábrán meggyelheto, objektum méretével. Ha túl nagyok a cellák, akkor túl sok objektum esik egy adott cellába,  ami szélsoséges esetben nem gyorsít a keresésen. Ha túl kicsik a cellák, akkor a nagyobb  objektumok túl sok cellát fednek le, ami szintén nem elonyös. A probléma megoldható több,  rácsállandójú grid-szint bevezetésével. eltéro A grid index egyszeru  és hatékony módja a térbeli indexelésnek. Számos kereskedelmi szoftver alkalmazza is, annak ellenére, hogy hiányosságai nyilvánvalók, különösen olyan esetekben, amikor az objektumok térbeli eloszlása nem egyenletes. Az volna ugyanis a  kívánatos, hogy lehetoleg minden cellába azonos számú objektum essen, ami az állandó  Az objektumok inhomogén térbeli rácsméret miatt nagyon kis valószínuséggel  fordul elo.  eloszlása esetén a második szurési  fázis hatékonysága erosen lecsökkenhet, ezért összetettebb és rugalmasabb indexelési algoritmusok használata is szükségessé válhat.

16.2.2. Négy-fa A négy-fa egy hierarchikus adatszerkezet, amely az oszd-meg-és-uralkodj elvhez hasonló rekurzív felbontás elvén alapszik. A sokféle négy-fa változatból mi most az úgynevezett pont-tartomány négy-fát vázoljuk fel. Az indexelés alapja az adott síktartomány rekurzív felosztása négy síknegyedre (16.9. ábra).

691

16.2. Térbeli indexelés

16.9. ábra. A rekurzív térfelosztás.

Az indexeléshez használt struktúra egy olyan fa szerkezetként ábrázolható, melynek  csúcsa egy-egy síktartományt reprezentál, leveleiben pedig az objektumok minden belso  csúcs tartalhelyezkednek el. A fa gyökere megfelel a kezdeti tartománynak. Minden belso  mazza saját felosztásának középpontját, valamint négy mutatót a felosztás után keletkezo  csúcsokra (jelölje ezeket az égtájak angol rövidítéseinek négy új tartománynak megfelelo   mezo megfeleloen NW, NE, SE és SW ). Ha egy csúcs levél, akkor a csúcs egy ezt jelzo  jét igazra állítjuk. A levelek vagy üresek – ezt egy külön mezoben feljegyezzük –, vagy pedig egy objektumot tartalmaznak, koordinátáival és egyéb attribútumaival, vagy ezt kiváltandó egy mutatót az objektum adatbázisbeli reprezentációjára. A levelek NW, NE, SE  deniálatlanok. Megjegyzendo,  hogy a belso  csúcsok felosztást reprezentáló és SW mezoi pontját csúcsonként tárolni nem feltétlenül szükséges. Mivel a felosztás mindig egyértelmu,   megvalósításával a felosztásra vonatkozó információk táezért a fa muveleteinek  megfelelo  A 16.10. ábra egy hét objektumot tartalmazó négy-fát rolása a csomópontokban elkerülheto. szemléltet, feltüntetve az objektumok koordinátáit. A fa felépítése az objektumok egyenkénti beszúrását jelenti. Ehhez elindulunk a fa gyö és egészen addig haladunk lefelé, amíg levélbe nem érkezünk. A bejárás során a kerétol, beszúrandó objektumot reprezentáló pont koordinátái alapján választjuk ki az adott csomó gyerekét. Ha levélbe érkeztünk és az üres, beszúrjuk az új pontot. Ha a levél pont megfelelo már tartalmaz egy objektumot, akkor az aktuális tartományt újra és újra fel kell osztanunk, egészen addig, amíg a régi és új csúcs már nem esik azonos tartományba. Ez a felosztás sok új altartomány létrehozását is jelentheti, ha a régi és új pontok távolsága kicsi. A felosztásokat megszüntethetjük pontok törlésekor. Ha egy pont törlésével az adott tartomány már csak egy pontot tartalmaz, akkor az altartományai összevonhatók. Nézzük meg, hogyan valósítható meg egy olyan keresés, amely a négy-fában repre objektumokat állítja elo.  A N´ zentált, viewportba eso -- algoritmus adott (x1 , y1 )

< x2 és < y2 , valamint feltesszük, hogy a viewport a reprezentált síkrészbe esik. A keresés során

 objektumokat adja vissza, ahol x1 és (x2 , y2 ) pontokkal deniált viewportba eso y1

 sorrendben bejárjuk azokat a csúcsokat, melyek tartalegy mélységi bejárásnak megfelelo  objektumot. Az eljárás megkapja az épp aktuális csúcsot (n pamazhatnak a viewportba eso

692

16. Térinformatika

(100, 100)

(0, 100) (6, 90)

(6, 90)

(88, 56)

(88, 56) (54, 46) (65, 36)

(85, 28)

(14, 4)

(72, 34) (85, 28)

(54,46)

(14,4) (100, 0)

(0, 0)

(65, 36) (72, 34)

16.10. ábra. Hét objektumot tartalmazó pont-tartomány négy-fa.

raméter), valamint a viewport koordinátáit. Az n csúcs koordinátáit koordX[n] és koordY [n], levél tulajdonságát levél[n], üres voltát üres[n], az általa reprezentált felosztás középpont tartalmazzák. A teljes fában jának koordinátáit pedig felosztásX[n] és felosztásY [n] mezok való kereséshez a fa gyökerével kell elindítani az algoritmust. N´ --(n, x1 , y1 , x2 , y2 ) 1 2

if levél[n]

4

else if if

7 8

if

9 10 11

¬ üres[n] ∧

x1

then return n

5 6

≤ koordX[n] ≤ x2 ∧ y1 ≤ koordY [n] ≤ y2 B Megtaláltunk egy viewporton belüli objektumot. felosztásX[n] > x1 ∧ felosztásY [n] < y1 B Gyerekek rekurzív bejárása. then N´ --(NW [n], x1 , y1 , x2 , y2 ) felosztásX[n] < x2 ∧ felosztásY [n] < y1 then N´ --(NE[n], x1 , y1 , x2 , y2 ) felosztásX[n] < x2 ∧ felosztásY [n] > y2 then N´ --(SE[n], x1 , y1 , x2 , y2 ) felosztásX[n] > x1 ∧ felosztásY [n] > y2 then N´ --(SW [n], x1 , y1 , x2 , y2 )

then if

3

if

A fa mérete és alakja fontos a keresés, beszúrás és törlés muveletek  hatékonyságának szempontjából. A pont-tartomány négy-fa szerkezete a x térfelosztás miatt független a  alakja és mérete viszont függ a beszúrt objektumoktól. A fa mubeszúrások sorrendjétol,    függ. A fa minimális mélysége M obveleteinek futásideje alapvetoen a fa mélységétol jektum esetén

dlog4 (M − 1)e,

ekkor minden objektum azonos szinten helyezkedik el, a fa

kiegyensúlyozott. A fa azonban általában nem rendelkezik ezzel a hasznos tulajdonsággal,  felso  korlátot sem tudunk adni mélységére – az függ ugyanis az objektumok páronkénti sot távolságától. Ahhoz ugyanis, hogy a fába beszúrjunk két pontot, mindenképp fel kell építenünk a fát legalább olyan mélységben, hogy a két pont közé essen egy tartomány-határ.  Minél kisebb viszont a pontok távolsága, várhatóan ez annál késobb (annál mélyebb fát felépítve) következik be. Ha feltesszük, hogy az objektum-halmazunkban két pont távolsága

693

16.2. Térbeli indexelés

16.11. ábra. Négy-fa és a poligonok befoglaló négyszögei.

legalább d , valamint a tartományunk kiterjedése kezdetben r, akkor a fa mélységére adható egy

dlog2 (



2(r /d))e korlát. Legrosszabb esetben ugyanis egy d hosszú szakasz valamely

 vetülete d / koordináta-tengelyre eso



 legfeljebb r /(d / 2 hosszú, amibol



2) darab illeszt-

 egy r hosszú szakaszra. heto Indexeléshez célszeru  lehet egy olyan négy-fa változat használata, ahol a tartományok felosztásának feltételét a blokkmérethez igazítjuk, azaz csak akkor osztjuk tovább az adott  pontok tárolásához szükséges lemezterület túlcsordul a blokk síkrészt, ha a síkrészbe eso méretén. A fa ezen változatában a levelek nem egy-egy objektumot, hanem objektumok halmazát tartalmazzák, melyeket azonos blokkban tárolunk. Poligonok esetére a helyzet nem olyan egyszeru,  mint pontokra. A poligon összetett objektum, amelyet számos pont alkot. A poligonok indexeléséhez felhasználjuk a centroid  objektum alkalmas arra, hogy vavagy a befoglaló négyszög fogalmát. Mindkét helyettesíto  besoroláshoz megfeleloen  lamely térnegyedbe történo reprezentálja a poligont. A centroid egy és csak egy térnegyedbe való besorolást enged meg, míg a befoglaló négyszög alkalmazásával egy-egy objektum több térnegyedbe is eshet, amint az a 16.11. ábrán látható.  adatokra vizsgáltuk a négy-fa algoritAz eddigi példákban vektoros modellt követo must. A módszer raszteres adatmodellre is jól alkalmazható, mivel az adatok térbeli eloszlása teljes mértékben egyenletes, tekintettel a raszteres modell természetére. Raszteres adatmodell esetében célszeru  lehet az úgynevezett tartomány négy-fák használata. Ezek felépítése hasonló, mint a pont-tartomány négy-fáké, csak a levelek az adott al-tartomány egészére vonatkozó információkat tárolnak. Ez a fa jól használható például képek tömörítésére: végezzük a felosztást addig, amíg az al-tartomány homogén területet nem reprezentál, ekkor a tartomány intenzitását tároljuk a levelekben.

694

16. Térinformatika

16.12. ábra. A nyolc-fa térfelosztása.

16.2.3. Nyolc-fa A négy-fa háromdimenziós kiterjesztése a nyolc-fa. Speciális esetekben használatos, mint  például háromdimenziós objektumok (geológiai képzodmények, földalatti olajtárolók stb.) leírására. A 16.12. ábra a nyolc-fa térfelosztását szemlélteti. Osszuk a teret nyolc tértartományra, majd minden tartományt további nyolcra egészen  térnyolcadban már csak egyetlen pont van. A négy-fa addig, amíg a fa adott szintjén lévo mintájára megalkotható egy olyan fa, amely segítségével az adott objektum attribútumaival együtt gyorsan azonosítható. A 16.12. ábra tartományait egy egyértelmu  rendezés szerint megszámoztuk. Ezen és ha sonló rendezések célja az, hogy háromdimenziós tértartományok (vagy az oket reprezentáló  Ezzel lehetové  pontok) egy egyértelmu  sorrendjét állítsuk elo. válik, hogy a tértartományo kat – vagy általánosabban tetszoleges térbeli objektumhalmazt – egydimenziós térbe képezzünk le, ahol már használhatjuk a hagyományos, elterjedt indexelési technikákat, például a B-fát.  A legismertebb eljárás olyan térbeli görbe eloállítására, amely egyszer érinti a tér minden objektumát, az úgynevezett Peano rendezésen alapszik. Lényege, hogy összefésüljük az adott pont kettes számrendszerben felírt koordinátáit valamely rögzített sorrendben (pél bitje, y elso  bitje, z elso  bitje, x második bitje és így tovább). A pontokhoz így dául x elso  sorrendet használva oldjuk meg a tér pontjainak bejárását, rendelt értékek szerinti növekvo rendezését.

Gyakorlatok

  négy-fát egy (60, 38) és egy (67, 30) koordinátájú 16.2-1. Bovítsük a 16.10. ábrán szereplo

objektummal.  16.2-2. Lássuk be, hogy adott koordinátájú pont keresése a négy-fában O(h) idoben megoldható, ahol h a fa mélysége.

16.3. Digitális sz¶rési eljárások A térinformatika egy másik fontos területe a digitális képek, urfotók  feldolgozása. A képi  szoftverek számos képfeldolgozó, szur  algoritmuson alapuló eljárást taradatokat kezelo  o

695

16.3. Digitális szurési  eljárások

16.13. ábra. Az RGB színkocka.

talmaznak. Ezen eljárások közül mutatunk be néhány fontosabbat, mint például alul- és fel  o,  éldetektáló szur  ülvágó szur  ok, élmegorz  ok. A digitális képek feldolgozása során számos  hatást, szurési  eljárásnak vetjük alá a képeket annak érdekében, hogy számunkra kedvezo  változást érjünk el. Felhasználási céljainktól függoen lehetséges, hogy szeretnénk eltüntetni  a nagyfrekvenciás változásokat, vagyis simító szurést a képekrol  hajtunk végre, vagy szeretnénk kiemelni a képen látható éleket. Az eljárások megértéséhez át kell tekintenünk néhány alapfogalmat.

16.3.1. Az RGB színmodell   A számítástechnika fejlodésével lehetové vált, hogy a szemünk színlátó képességét meghaladó számú színt legyünk képesek ábrázolni. Amióta létezik a 24 bites színmodell, valósághunek  látszanak a digitális képek. Legyen három koordináta tengelyünk, amely a három alapszínt szimbolizálja, RGB: Red (vörös), Green (zöld) és Blue (kék). E három szín intenzitását ábrázoljuk 0–255 között. A teljesen sötét zöld (vagyis fekete) legyen 0, a teljesen világos pedig 255, valamint a többi két alapszínre is ugyanígy járjunk el. Az abszolút fekete pontban (Black) mindhárom alapszín intenzitás értéke 0, míg az abszolút fehér pontban  (White) 255. A 24 bites színmodellt szemlélteti az 16.13. ábra. Bármely szín eloállítható e  módon: három alapszín kombinációjából, a következo colour

= a · Red + b · Green + c · Blue ,

ahol a, b, c az egyes alapszínek intenzitása. Egy-egy alapszín intenzitása tehát 256 féle értéket vehet fel, így 256 féle zöld árnya latból, 256 féle vörös árnyalatból és 256 féle kék árnyalatból állítható össze egy tetszoleges szín, vagyis összesen 256 · 256 · 256 szín ábrázolható. Mivel 256

= 28 , így 28 · 28 · 28 = 224

 féle színárnyalatot tudunk eloállítani. A 16.14. ábrán a NASA egy LANDSAT muholdja  által készített kép három RGB sávjának intenzitásait és az azokból képzett színes képet lát hatjuk. Az eroforrás kutató muholdak  frekvencia sávokban érzékelnek, amelyek nemcsak a látható tartományt fogják át, hanem gyakran infravörös sávokat is. Így az RGB színkocka több dimenziós is lehet, mint három. Az RGB színkocka mintájára a látható színeket más  sávokkal is (pl. infravörös sávok) helyettesíthetjük, így hamis színes képeket állíthatunk elo.  különVezessük még be a térbeli frekvencia fogalmát, amely az egységnyi távolságra eso  intenzitás értékek számát méri. A 16.15. ábra a térbeli frekvencia fogalmát szemlélteti. bözo

696

16. Térinformatika

16.14. ábra. Egy LANDSAT muhold  felvétele: az RGB sávok és a sávokból összeállított kép. Az ábra színes változata az 812. oldalon látható.

16.15. ábra. A térbeli frekvencia szemléletes jelentése.

16.16. ábra. Egy kép intenzitás értékeinek eloszlása (hisztogramja).

16.3.2. Hisztogram kiegyenlítés  módszerek és a környezeti körülmények miatt a digitális képek intenA digitális leképezo zitásának dinamika tartománya kisebb, mint a lehetséges, vagyis a kép legsötétebb pontja általában világosabb, mint az abszolút fekete pont, valamint a legvilágosabb pontja sötétebb, mint az abszolút fehér pont, ahogy az a 16.16. ábrán látható. Toljuk el a kép legsötétebb pontjának intenzitását az abszolút fekete pontba, a legvilágosabb pont intenzitását az abszolút fehér pontba, és az összes többi pont intenzitás ezzel arányosan változtassuk meg. Ezzel megnöveltük a pixelek közti intenzitás különbséget, ezáltal kontrasztosabbá tettük a képet.  Tekintsünk egy valós esetet, mégpedig a 16.17. ábrát, mely egy francia SPOT muhold által készített kép. A kép hisztogramját a 16.18. ábra mutatja. Amint látható elég keskeny sávban mozognak a kép intenzitás értékei, ezért is találjuk a képet kicsit túl szürkének. Vé transzformációt, amelynek az eredményét a 16.19. ábra mutatja. gezzük el a kontrasztnövelo

697

16.3. Digitális szurési  eljárások

16.17. ábra. Az eredeti SPOT felvétel.

16.18. ábra. A SPOT kép intenzitás eloszlása.

16.3.3. Fourier-transzformáció  A Fourier-transzformációt számos mu  részletesen tárgyalja, tehát csak érintolegesen mutat nem periodikus függvénye. Írjuk juk be a legfontosabb összefüggéseket. Legyen s(t) az ido  kifejezést: fel a következo

Z S(f)



=

−2πi f t

s(t)e

dt

,

−∞ ahol S ( f ) az s(t) függvény Fourier-transzformáltja, vagyis a frekvencia tartománybeli



−1. S ( f )-t gyakran nevezik s(t) spektrumának is, az elképe”, f a frekvencia és i = ” járást pedig Fourier-transzformációnak.

698

16. Térinformatika

16.19. ábra. A hisztogram kiegyenlítéssel megnövelt kontrasztú kép. Az ábra színes változata az 813. oldalon látható.

 kifejezést, amelyet inverz Fourier-transzformációnak is neveznek: Írjuk fel a következo

Z

s(t)



=

2πi f t

S ( f )e

dt

.

−∞ A Fourier-transzformált létezésének elégséges feltétele, hogy s(t) függvény szakaszonként sima (vagyis deriváltja véges számú hely kivételével folytonos), valamint az

Z



| s(t)|dt −∞ kifejezés konvergens legyen. Ebben az esetben az S ( f ) Fourier-transzformált meghatározható.

16.3.4. Néhány speciális függvény Fourier-transzformáltja A szurési  eljárások bemutatásakor szükségünk lesz néhány speciális függvény Fouriertranszformáltjára. Az egyik ilyen kiemelten fontos függvény a négyszög függvény. Négyszögimpulzus Számunkra az úgynevezett tranziens függvények érdekesek, vagyis amelyek nem periodikusak, hanem véges hosszúságú intervallumon különböznek a nullától. Vizsgáljuk meg néhány tranziens függvény Fourier-transzformáltját. Az egyik fontos függvény a négyszö gimpulzus (16.20. ábra), amely a következo:

( s(t)

=

a,

ha |t|

0

egyébként .

< τ/2 ,

699

16.3. Digitális szurési  eljárások

16.20. ábra. A négyszögimpulzus.

16.21. ábra. A négyszög impulzus Fourier-transzformáltja a sinc függvény.

Végezzük el a függvény Fourier-transzformációját:

Z S(f)

Z



=

s(t)e

−2πi f t

dt

τ/2

=a

−∞

−2πi f t

e

−τ/2

dt

= aτ

sin π f τ

πfτ

.

Ezt a függvényt szinusz kardinálisz függvénynek is nevezik és sinc-vel jelölik (16.21.  hogy egy frekvencia tartománybeli négyszög függvény Fourierábra). Kézenfekvo,  tartománybeli sinc függvény lesz. Ennek a ténynek nagy jelentosége  transzformáltja az ido  megvalósításakor. lesz az ideális felülvágó szur  o Nézzük meg most azt a speciális esetet, amikor a négyszög egységnyi területu,  vagyis aτ

= 1, vagyis a = 1/τ. Ez szavakban kifejezve annyit jelent, hogy minél keskenyebb a jel,

annál magasabb lesz a négyszögimpulzus. Dirac-δ Paul Dirac vezette be a róla elnevezett

δ-t pontszeru objektumok leírására. Használata meg-

könnyíti a digitális adatrendszerek leírását számos vonatkozásban. Deníció szerint legyen

δ

egy olyan függvény (klasszikus értelemben nem az, hanem úgynevezett disztribúció),

melyre

δ(t) = 0 ha t , 0, és

Z



δ(t)dt = 1 . −∞ A Dirac-δ szemléletes jelentése egy végtelenül keskeny, és végtelenül magas amplitúdójú impulzus, amelynek görbe alatti területe egységnyi. Számunkra azért fontos a

δ-val

való

700

16. Térinformatika

foglalkozás, mert számos olyan tulajdonsága van, amely a jelfeldolgozás szempontjából lényeges. A t

= t0

esetre alkalmazva a

δ-t, azt kapjuk, hogy δ(t − t0 ) = 0, ha t , t0 .

Lássuk egyik fontos tulajdonságát, amelyet kiválasztó tulajdonságnak nevezhetünk.

δ(t − t0 ) -val. Ekkor

Szorozzunk meg az f (t) függvényt a

δ(t − t0 ) f (t) = δ(t − t0 ) f (t0 ) , Z

mivel

∞ −∞

Ez a kiválasztási képesség, vagyis a

δ(t − t0 ) f (t)dt = δ(t0 ) az

f (t0 )

.

 kiválasztotta a t0 -hoz tartozó f (t) függvénybol

értéket.  A következokben vizsgáljuk meg egy Dirac-impulzus és egy Dirac-impulzus sorozat Fourier-transzformáltját. Jelölje F a Fourier-transzformációt, amely a deníciója alapján

Z F {δ(t)}



=

δ(t)e−2πi f t = 1 .

−∞  Dirac-impulzus Fourier-transzformáltja pedig Nem az origóban lévo

Z F {δ(t



− a)} =

δ(t − a)e−2πi f t = e−2πi f a ,

−∞  Euler óta tudjuk, hogy amirol

−2πi f a

e

= cos 2π f a − i sin 2π f a .

 tartományban) Fourier-transzformáltja: Dirac-impulzus sorozat (az ido

  ∞ ∞      1 X X δ (t − kτ) = F δ( f − k/τ) .    τ  k=−∞ k=−∞

16.3.5. Konvolúció Legyenek f1 és f2 folytonos függvények. Jelölje konvolúciójukat h

=

f1



f2 , melyet a

 kifejezés deniál: következo

Z h(t)

=

f1 (t)



f2 (t)



= −∞

f1 (τ) f2 (t

− τ)dτ .

 tartományA 16.22. ábra grakusan szemlélteti két négyszög függvény konvolúcióját az ido ban. Vizsgáljuk meg egy konkrét esetet, ahol digitális jelekre alkalmazzuk az összefüggést: legyen h(t) a t-edik pillanatban az f1 és f2 függvények konvolúciója, amit úgy kapunk, hogy az f1 t-edik pillanatban felvett értékét összeszorzunk az f2 (t

− τ) -edik értékével, majd vé-

gigfutunk f2 egész intervallumán (ami valóságos esetekben véges intervallum, jelen esetben M) és összegezzük a szorzatokat (futó összegzés). A folyamatot a 16.23. ábra szemlélteti.

16.3. Digitális szurési  eljárások

 tartományban. 16.22. ábra. Két négyszög függvény konvolúciója az ido

16.23. ábra. A konvolúció szemléletes jelentése.

701

702

16. Térinformatika

Az eddigiekben csak egydimenziós függvényekkel foglalkoztunk. Könnyen általánosítható a konvolúció fogalma kétdimenziós függvényekre is, mint amilyen a digitális kép. A konvolúció tulajdonságai   A következokben röviden összefoglaljuk a konvolúció fobb tulajdonságait, bizonyítás nélkül.



A konvolúció kommutatív: f (t)



.

∗ [g(t) ∗ h(t)] = [ f (t) ∗ g(t)] ∗ h(t) .

A konvolúció disztributív: f (t)



f (t)

A konvolúció asszociatív: f (t)



∗ g(t) = g(t) ∗

∗ [g(t) + h(t)] =

f (t)

∗ g(t) +

f (t)

∗ h(t) .

 Szorzat Fourier-transzformáltja a tényezok spektrumainak konvolúciója. Jelölje F a Fourier-transzformációt. Ekkor F {g(t)h(t)}

= G( f ) ∗ H( f ) ,

ahol G( f ) és H( f ) a g(t) és h(t) függvények spektrumai.



Függvények konvolúciójának Fourier-transzformáltja a spektrumok szorzata: F {g(t)

∗ h(t)} = G( f )H( f ) ,

ahol G( f ) és H( f ) az g(t) és h(t) függvények spektrumai.



Konvolváljuk az f (t) függvényt egy Dirac-impulzussal. f (t)

∗ δ(t − t0 ) =

f (t

− t0 ) .

 helyre. A Dirac-impulzus eltolja a függvényt a saját argumentumában szereplo



Szorzás végtelen Dirac-δ sorozattal:

∞ X g(t)

δ(t − kτ) =

k=−∞

∞ X

g(kτ)δ(t

− kτ) .

k=−∞

A végtelen Dirac-δ sorozattal szorozva csak a kτ helyeken felvett értékeket tartjuk meg, és ez éppen a mintavételezésnek felel meg.

703

16.3. Digitális szurési  eljárások

16.3.6. Sz¶rési algoritmusok A digitális szurési  módszerek egyik legfontosabb fogalma a kernel. Jelentése mag. A szurési   tartományban dolgoznak, a kernellel konvolválják a szurend  képet. eljárások, amikor az ido  o A szurés  hatása attól függ, hogy milyen függvény értékeit tesszük be a kernelbe, ami egy n

× n-es mátrix. Ha meg tudjuk adni, hogy milyen átviteli függvényt kívánunk megvalósí-

tani a frekvencia tartományban, akkor annak inverz Fourier-transzformálásával megkapjuk  tartománybeli függvényt, amelyet megfeleloen   az ido mintavételezve megkapjuk a szur  oe szur  gyütthatókat, vagyis a kernelbe töltendo  oegyütthatókat. A digitális konvolúció tehát a  tartoszurések  végrehajtásának egyik lehetséges módja. Ebben az esetben a szurést  az ido  módon: mányban végezzük a következo

0

g (t)

= g(t) ∗ s(t) , 0

 tartományban, g (t) a szurt ahol g(t) az eredeti adatrendszer az ido  adatrendszer és s(t) a kernel. Egy

másik

lehetséges

megoldás,

hogy

a

 szurend  o

adatrendszert

Fourier-

transzformáljuk, majd a frekvencia tartományban végezzük el a szurést  (a Fouriertranszformáltat megszorozzuk a kívánt hatást biztosító átviteli függvénnyel), majd az így kapott spektrumot inverz Fourier-transzformáljuk.

G( f )

0

G (f)

0 g (t)

= = =

F {g(t)}

, , ( f )} ,

G( f )S ( f ) F

−1

{G

0

ahol g(t) az eredeti adatrendszer, G( f ) az adatrendszer Fourier-transzformáltja, S ( f ) a kí-

0

0

vánt átviteli függvény, G ( f ) a szurt  adatrendszer a frekvencia tartományban, g (t) a szurt   tartományban, F a direkt, és F adatrendszer az ido

−1

az inverz Fourier-transzformációt szim-

bolizálja. A digitális Fourier-transzformáció gyors végrehajtásához létezik az úgynevezett gyors Fourier-transzformáció algoritmus (FFT), amely gyorsan képes elvégezni a transzfor esetén játszik kulcsmációt. A kernel megállapítása nemcsak a frekvencia szerinti szur  ok  o,  élkiemelo  fontosságú szerepet, hanem más egyéb esetekben is, mint például az élmegorz   cél néha olyan, hogy nem adható meg egy egyszeru szur  ok. Az elérendo  átviteli függvénnyel  a muvelet,  hiszen pontról pontra változhat az algoritmus által eloírt tennivaló.  oekben  A K felvázolt szurési  módszer egy lehetséges meg´  ´ algoritmus az eloz valósítása. Bemenetként megkap egy M

×M

méretu  F képet és egy K

×K

méretu  H kon-

volúciós mátrixot (kernelt), eredményként pedig visszaadja a G képet, amely az eredeti F kép konvolúciója a H kernellel. A képek, valamint a kernel pontjainak indexelését nullá az összeadás és szorzás muveletek  val kezdjük. A képekrol  értelmezhetoségének érdekében feltesszük, hogy szürkeárnyalatosak. A feldolgozás során az algoritmus illeszti a kernelt F  kimeneti képpont kezdeti sarkába, majd meghatározza a kernel középpontjának megfelelo színét a kernel által lefedett képpontok súlyozott összegeként. Ezután elcsúsztatja a kernelt  vízszintesen majd függolegesen egészen addig, amíg az összes lehetséges illesztés meg nem  történt. A 16.24. ábra a feldolgozás folyamatát szemlélteti egy háromszor hármas – erosen felnagyított – kernellel.

704

16. Térinformatika

 16.24. ábra. Az erosen felnagyított kernel mozgása a képen (LANDSAT képrészlet). Az ábra színes változata az 813. oldalon látható.

K ´  ´ (F, H, K, M)



1

N

2

for x

3 4 5 6 7

K

2

← 0 to M − K do for y ← 0 to M − K do for i ← 0 to K − 1 do for j ← 0 to K − 1 do G(x, y) ← G(x, y) + (H(i,

B Beállítjuk a normalizációs konstanst. B Sorra vesszük az eredeti kép pontjait.

j)F(x

B Sorra vesszük a kernel pontjait. + i, y + j))/N

return G

 Figyeljük meg, hogy a kimeneti G kép tetszoleges (x, y) pontja nem esik egybe az eredeti F kép (x, y) pontjával. Ennek oka, hogy az eredeti kép határaira csak úgy tudjuk illesz tehát a muvelethez lelóg” az eredeti képrol,  szükséges ” környezet nem teljesen ismert. Ezt a problémát a K  úgy ´  ´ algoritmus egyszeruen

teni a kernel középpontját, hogy az

 kép nem tartalmazza az itt említett határpontooldja meg, hogy az eredményként keletkezo  kat. Csak azon pontokhoz rendel pontot az eredmény képben, melyekre megfeleloen illeszt a konvolúciós mátrix. Egy másik lehetséges megoldás a hiányzó szomszédsági pontok heto pótlása valamilyen értékkel, például a határolópontok másolása az ismeretlen területre.   értéket felAz N normalizációs konstans elméletileg tetszoleges (nullától különbözo) vehet, az algoritmus most a kernel pontjainak számával normalizál.

705

16.3. Digitális szurési  eljárások

 átviteli függvénye (Fourier-transzformáltja a sinc függvény). 16.25. ábra. A felülvágó szur  o

16.26. ábra. A kétdimenziós sinc függvény, mint az ideális felülvágás kernel függvénye.

A feldolgozás során bejárjuk az eredeti M × M méretu  F kép minden – nem képhatáron  – pontját, melyek száma (M − K + 1) lévo

2

lefedett K

2

, mindig feldolgozva a K × K méretu H kernel által

darab pontot. Ezt gyelembe véve – vagy megvizsgálva az egymásba ágyazott

ciklusokat – a K ´  ´ algoritmus futási ideje O((M

− K + 1)2 K 2 ).

 Felülvágó szur  o  amikor a frekvencia tartományban egy bizonyos felso  Akkor használunk felülvágó szur  ot, határfrekvenciánál ( f f ) nagyobb frekvenciákat 0-val szorzunk, és a nála kisebbeket 1-gyel. A 16.25. ábra mutatja az ideális felülvágás átviteli függvényét. Ami a frekvencia tartomány tartományban konvolúció. ban szorzás, az ido  tudjuk, hogy Fourier-transzformáltja a sinc függvény. A 16.26. A négyszög függvényrol ábrán a kétdimenziós sinc-t láthatjuk, mint az ideális felülvágás kernel függvényét. A felülvágó algoritmus végrehajtásához a kernelbe betöltjük a kétdimenziós sinc függ vény megfeleloen mintavételezett értékeit, majd a fent leírt módon végrehajtjuk a digitális konvolúciót.  Alulvágó szur  o  akkor alkalmazzuk, ha az alacsony frekvenciás jeleket el akarjuk tüntetni Az alulvágó szur  ot  Átviteli függvénye a 16.27. ábrán látható. a képrol. Ha alaposabban szemügyre vesszük az alulvágás és a felülvágás átviteli függvényét, akkor észrevehetjük, hogy S

f a(

f)

=

1

− S f f ( f ), vagyis az

fa alsó határfrekvenciájú alulvágó

 határfrekvenciájú felülvágó szur  átviteli függvényének átviteli függvényének és az f f felso  o összege azonosan 1 (feltéve, hogy fa

=

 következoen,   határfrekf f ). Ebbol ha az f f felso

706

16. Térinformatika

16.27. ábra. Az ideális alulvágás átviteli függvénye.

 átviteli függvénye. 16.28. ábra. Az ideális sávszur  o

 akkor az ugyanazon (alsó) venciájú felülvágóhoz tartozó sinc függvényt levonjuk 1-bol,  szur  határfrekvenciájú alulvágó szur  o  oegyütthatóit kapjuk meg. Jelölje F a direkt, F

−1

az inverz Fourier-transzformációt, melynek azonosságai alapján

 felírható a következo: F ahol S

f a(

−1

{S f a ( f )} = F {1} − F −1 {S f a ( f )} = 1 − s f a (t) ,

 átviteli függvénye, s f a (t) pedig az f ) az fa alsó határfrekvenciájú alulvágó szur  o

átviteli függvény inverz Fourier-transzformáltja.  Sávszur  o  egy olyan szur  amely egy adott alsó határfrekvencia alatt és egy felso  haA sávszur  o  o, tárfrekvencia felett nem enged át. Átviteli függvénye a 16.28. ábrán látható. Kerneljét úgy  határfrekvenciához, majd az fa alsó határfrekkaphatjuk meg, hogy kiszámítjuk az f f felso venciához tartozó sinc függvényeket, és ezeket kivonjuk egymásból.  szur  Az fa és f f frekvenciák egymáshoz közelítésével nagyon keskeny sávot átengedo  ot hozhatunk létre. Ha ezt alkalmazzuk, majd az eredményt az eredeti képadatokból kivonjuk, úgynevezett lyukszurést  végzünk.  o  szur  Élmegorz  ok  ok  olyan speciális szur  Az élmegorz  ok, amelyek átviteli függvényei nem adhatók meg. Mu  ködésük meglehetosen egyszeru  algoritmus szerint történik. A kernelt mozgassuk végig a  pixelek értékeit. Rendezzük nagyság szerint sorba képen, és töltsük fel az éppen alatta lévo a kernel elemeit, és a rendezett adatsor valamelyik elemét rendeljük hozzá a kernel szim pixelhez, amelynek ez lesz a szurt  az metria középpontja alatt lévo  értéke. Ezek a szur  ok  a medián szur úgynevezett rangszur  ok.  Az egyik legismertebb rangszur  o  o,  amely a sorba  elemének értékét rendeli a pixel szurt rendezett értékek sorban középso  értékének.

707

16.3. Digitális szurési  eljárások

 16.29. ábra. Egy egydimenziós idofüggvény (szaggatott vonal) és medián-szurt  változata (folytonos vonal).

  A 16.29. ábrán egy idosorra alkalmaztuk a medián szur  ot.  hogy a fel- vagy lefutó éleken a szur  nem változtatja meg az eredeti Jól meggyelheto,  o adatokat, hiszen azok az éleken már eleve nagyság szerint rendezettek. Nem éleken azon ban eroteljesen simít. A simítás mértéke a kernel hosszától függ, annál jobban simít, minél hosszabb. A 16.30. ábrán egy LANDSAT képrészlet és medián-szurt  változata látható. Éldetektorok Az éldetektálás különösen fontos szerepet játszik az alakfelismerésben, a raszteres térképek vektorossá alakításában. Az élek a képnek azon helyei, ahol az intenzitás megváltozása a  legnagyobb. Eloször is döntsük el, hogy mennyire kinomult élek kimutatását szeretnénk. A legtöbbször érdemes simító vagy medián szurésnek  alávetni a képet, hogy ne mutassunk ki minden apró, jelentéktelen élt. A simítás egyik ismert és egyszeru  módja a kép és egy gσ (x)

= √

1

− x2

2πσ

e 2πσ2

Gauss-függvény konvolúciója. Legyen h az f és g függvények konvolúciója. Kimutatható, hogy h

= ( f ∗ g)0 =

f

∗ g0 ,

vagyis egy jel (jelöljük f -fel) Gauss-függvénnyel (g) való konvolúciójának a deriváltja

708

16. Térinformatika

16.30. ábra. A bal oldali kép az eredeti, míg a jobb oldali egy kilenc pontos (9

× 9 pixeles) medián-szurt  kép. Az

ábra színes változata az 814. oldalon látható.

 a jel és a Gauss-függvény deriváltjának a konvolúciójával. Ezek alapján az éldeegyenlo  tektálás algoritmusa a következo.

0

É ´  ´ ( f, g )

0

1

konvolváljuk f -et g -vel

2

számítsuk ki h abszolút értékét

3

deniáljuk éleknek mindazokat a helyeket, ahol a h abszolút értéke meghalad  egy elore meghatározott küszöb értéket Nem használtuk ki sehol a gondolatmenet során, hogy egy vagy kétdimenziós esettel

 van-e dolgunk, így az éldetektálás fenti módja képek esetére is muköd  oképes. Ez az eljárás a Canny-féle éldetektor. Sokféle éldetektáló kernel létezik még. Egy másik, ismert éldetektáló  az emboss-szur szur  o  o.  Kernelje (3

 × 3-as méretu esetben) a következo: 1

0

0

0

0 0

0

0

−1 .

 tulajdonsága, hogy az ÉNY-DK irány kitüntetett. Hatására a középponti kernel Feltun  o  alatti képpixel lenullázódik, ellenben a kitüntetett irányba eso  két pixel közül az egyik mezo pixel saját értékével, a másik pixel pedig értékének ellentettjével esik latba. Ezzel a muve  változások kiemelodnek,  lettel az ÉNY-DK irányba eso minden más elnyomódik. Ha másik  változások kapnak hangsúlyt. Az emboss irányt tüntetünk ki, akkor az abba az irányba eso szurés  eredményét mutatja 16.31. ábra. Az éldetektálók egy másik, gyakran alkalmazott eljárása a Laplace-szurés.  Hatása ha sonlít az emboss szur  ohöz, de nem tüntet ki irányokat. Mindenféle irányú éleket kiemel,

709

16.3. Digitális szurési  eljárások

16.31. ábra. A bal oldali kép az eredeti, a jobb oldali az emboss-szurt  változat. Az ábra színes változata az 814. oldalon látható.

16.32. ábra. A bal oldali az eredeti kép, a jobb oldali a Laplace-szurt  változata. Az ábra színes változata az 815. oldalon látható.

minden mást elnyom. Kernelje is érdekes.

−1 −2 −1

−2 12

−2

−1 −2 −1 .

Hatását egy szintetikus képen érzékeltetjük a 19.18. ábrán.

710

16. Térinformatika

16.33. ábra. A bal oldali az eredeti kép, a jobb oldali az emboss-szurt  változata. Az ábra színes változata az 815. oldalon látható.

Érdekes összehasonlítani a kétféle éldetektor eredményét a szintetikus képre. A 19.19. ábrán a szintetikus képet és az emboss-szurt  változatát láthatjuk.

Gyakorlatok  kifejezés: 16.3-1. Bizonyítsuk be, hogy igaz a következo (f

∗ g)0 =

f

∗ g0 .

 az ÉK–DNy, a második 16.3-2. Készítsünk három olyan 3 × 3-as méretu  kernelt, ahol az elso az ɖD, a harmadik a K–Ny irányú éleket emeli ki.

16.4. Mintavételezés  jelentoség  A szaktudományokban alapveto u  az adatnyerés folyamata, amely a technika mai színvonalán digitális adatnyerést vagy mintavételezést jelent. Mintavételezéskor gyakran  állítunk elo  digitális adatokat, máskor eleve diszkrét, esetleg nem szabályoanalóg jelekbol  mintavételi pontokban történik az adatnyerés. A mintavételezés folyamasan elhelyezkedo  tának megértése nagy jelentoség u,  mivel az adatokból levonható következtetések függhetnek a mintavételezés módjától. Képzeljük el a mintavételezést, mint egy kétállású kapcsoló berendezést, amely bekapcsolt állapotban rögzíti a mérendo  paraméval szabályozott méro  Más szavakkal azt is mondtert, kikapcsolt állapotban pedig mit sem tud a környezetérol.  hatjuk, hogy két mintavételi (ido)pont között bármi történik is, arról nem fogunk tudomást  berendezésünk ilyenkor kikapcsolt állapotban van. Belátható, hogy szerezni, mivel méro  ha surítjük ez a fajta hiányosság csökkentheto,  a mintavétel mintavételezési gyakoriságát,  állapothoz vagyis csökkentjük az érzékelés nélkül töltött üzemmód részarányát a muköd  o

711

16.4. Mintavételezés

16.34. ábra. A mintavételezés eredménye egy olyan impulzus sorozat, melynek tagjai az eredeti függvénynek a mintavételi helyen felvett értékei.

képest. Nevezzük mintavételi távolságnak a két érzékelés közötti intervallumot, amely, ha   dimenziójú, de lehet távolság dimenziójú is, ha két minidosorokról van szó, akkor ido  tavételi pont között térbeli távolságról van szó. A következokben vázlatosan áttekintjük a  esemintavételezés legfontosabb törvényszeruségeit,  egyenletes mintavételezést feltételezo  tekben. Az egyszeruség  kedvéért idosorokkal, vagyis egydimenziós problémákkal foglalkozunk, amik teljes mértékben általánosíthatók több dimenziós esetekre is, mint amilyen a digitális kép, vagy a háromdimenziós terepmodell.

16.4.1. Mintavételi tétel Legyen

τ

 az úgynevezett mintavételi távolság. Ábrázoljuk a g(t) idofüggvényt és a min-

tavételezés eszközét, a Dirac-impulzusok sorozatát, majd a mintavételezés eredményét, a   digitalizált idofüggvényt (16.34. ábra). A mintavételezés tehát nem más, mint a g(t) idofüggvény és a Dirac-impulzus sorozat szorzata:

∞ X g(t)

δ(t − kτ) =

k=−∞

∞ X

g(kτ)δ(t

− kτ) .

k=−∞

Vizsgáljuk meg az analóg és a mintavételezett függvény spektrumát. Jelöljük G( f )-fel az eredeti, és G d ( f )-fel a digitalizált függvény spektrumát. A Dirac-δ Fourier-transzformáltja és a konvolúció tételek felhasználásával felírható a mintavételezett függvény spektruma:

Gd ( f )

= G( f ) ∗

vagyis Gd ( f )

=

1

1

∞ X

τ k=−∞

∞ X

τ k=−∞

G( f

δ( f −



k

τ

)

k

τ

.

)

,

712

16. Térinformatika

Értelmezzük a kapott eredményt. A kifejezés jobb oldala szerint a digitalizált jel spektruma periodikus, ami azért érdekes, mert a periodikus függvények spektruma nem periodikus függvény, vagyis a mintavételezés az eredetileg nem periodikus spektrumot periodikussá teszi. A spektrumnak a

−1/2τ és 1/2τ közé eso részét a spektrum fo részének, az

fN

= 1/2τ

 rész fN periódusértéket Nyquist-frekvenciának nevezzük. A spektrum többi részén a fo  sal ismétlodik. A fenti formulákból világosan kiolvasható, hogy az analóg és a digitalizált  függvény spektruma jelentosen eltérhet egymástól, ha az analóg függvény bármilyen frek határfrekvencia ( f f ), venciájú jeleket is tartalmazhat. Ha azonban létezik egy olyan felso  (vagyis létezik a spektrumra felso  haamelynél nagyobb frekvenciájú jel nem fordulhat elo  határfrekvencia és a tárfrekvencia), akkor belátható, hogy a felso

τ mintavételi távolsággal

 legnagyobb frekvencia között igaz a következo  összefüggés: még átviheto ff



fN

,

vagyis

τ≤

1 2 ff

.

(16.1)

 legEz az összefüggés a mintavételi tétel. Jelentése, hogy mintavételezéskor a még átviheto nagyobb frekvenciához, f f -hez úgy kell megválasztanunk a

τ mintavételi távolságot, hogy

 teljesüljön a 16.1. egyenlotlenség. Ha túl kicsire választjuk a mintavételi távolságot, akkor feleslegesen sur  un  mintavételezett adatrendszert kapunk, ha viszont túl nagyra, mellyel nem   határfrekvencia szerinti áll fenn a 16.1. egyenlotlenség, akkor nem fog teljesülni az f f felso  rész ismétlodése  jelátvitel. Túlzottan ritka mintavételezéssel tehát felülvágást, és a fo miatt kisebb-nagyobb torzulást okozunk az adatrendszer spektrumán.

16.4.2. A mintavételi tétel néhány következménye Láthattuk, hogy bizonyos esetekben a digitalizálás (mintavételezés) adatvesztéssel járhat.  Tekintsük át, hogy mikor nem vesztünk adatot. A megfeleloen mintavételezett digitális adat az eredeti analóg jel pontosan visszaállítható. (Akkor mondjuk megfeleloen  rendszerbol  mintavételezettnek az adatrendszert, ha teljesült a mintavételi tétel 16.1. egyenlotlensége.)  o  részben láthattuk, hogy a mintavételezés periodikussá teszi a spektrumot. Ha ponAz eloz tosan vissza kívánjuk állítani az eredeti analóg jelet a mintavételezett jel G d ( f ) spektrumá részein kívüli részeit, vagyis meg kell szoroznunk ból, akkor el kell tüntetnünk a spektrum fo G d ( f )-t egy olyan négyszög függvénnyel, amelynek magassága

τ, szélessége 1/τ. Így egy-

szeruen  levágjuk a spektrum periodikus részeit, vagyis kiküszöböljük a mintavételezéssel belevitt periodicitást, azaz visszakapjuk az analóg jel spektrumát. Az ismertetett gondolat tartományban, ha a visszakapott spektrumot inverz menet akkor adja vissza a jelet az ido Fourier-transzformáljuk. Ismerve a konvolúció tulajdonságait és a négyszög függvény (inverz) Fourier-transzformáltját, belátható, hogy a

τ

magasságú és 1/τ szélességu  négyszög

függvénnyel való szorzás a frekvenciatartományban a sinc függvénnyel való konvolúciót  tartományban. Ez alapján a jel visszaállítása az ido  tartományban a következo  jelent az ido módon lehetséges:

 ∞   X   

k=−∞

 ∞  X   g(t)δ(t − kτ) sinc(t/τ) =  

k=−∞

g(kτ)sinc(t/τ

− k) ,

713

16.4. Mintavételezés

 argumentummal vett vagyis a visszaállított értékek a minták és a sinc függvény megfelelo értékeinek szorzata. Ez egyrészt azt jelenti, hogy az így visszakapott értékek pontosan azo nosak az egyes minták értékeivel, valamint az analóg függvény tetszoleges helyén felvett   argumentummal megadott sinc függvéértékek eloállíthatók a mintáknak és a megfelelo nyértékek szorzatának összegzésével. Természetesen csak akkor igazak ezek a megállapítások, ha teljesült a mintavételi tétel 16.1. feltétele. Túl nagyra választott mintavételi távolság esetén az analóg jel spektruma nem állítható vissza pontosan, mivel a túl ritka mintavétel felülvágást hajtott végre a spektrumban.

16.4.3. Két tipikus mintavételi probléma  A következokben bemutatunk két, a térinformatikában tipikus mintavételezési feladatot,  elmondottak. melyek megoldása során jól használhatók a mintavételrol Digitális fénykép   törA raszteres rendszerek tipikus adatnyerési módja a muholdakról  vagy repülogépekr ol  fényképezés. A bemutatott idofüggvényekhez  téno képes ezekben az esetekben a mintavételezés kétdimenziós, mivel a mintavételezést egy kétdimenziós Dirac-δ sorozattal végezzük, amelynek mindkét irányban

τ a mintavételi távolsága, a minták értéke pedig az adott Dirac-

 intenzitás és színérték. Mindez a gyakorlatban érzékelo  kamerákkal impulzus felett lévo valósítható meg, amelyeknek

 vannak. Ezen érzékelok  mérete τ rácsállandójú fényérzékeloi

 legnagyobb térbeli felbontó képességet, vagyis a fényképeken meghatározza az elérheto nem mutatható ki 2τ -nál kisebb részlet. Domborzati modellek A domborzati modellek megalkotásának egyik fontos állomása, hogy ismerjük szabályos rácspontokban a felszíni magasság értékeket. Ezen adatnyerési technikák ismertetését mel lozzük, ugyanakkor fontosnak tartjuk kiemelni a mintavételi tétel ide vonatkozó következményeit. A magasság értékek egy a felszínt leíró függvénynek egy

τ

rácsállandójú Dirac-

impulzus sorozattal való szorzásával kaphatók meg (19.20. ábra). A 16.36. ábrán egy valóságos domborzati modellt láthatunk, amelynek felbontóképessége körülbelül 5 méter, amivel a mintavételi tétel miatt 10 méternél kisebb horizontális kiterjedésu  felszíni egyenetlenség nem mutatható ki. Ezért csak építészeti, várostervezési  célú felhasználást enged meg. Ha például a felhoszakadások alkalmával lezúduló csapadékvíz lefolyását kívánnánk modellezni, akkor pontosabb (nagyobb felbontású) domborzati modellt kellene megalkotni. Általánosságban kimondható, hogy nincsenek univerzális, minden célra alkalmas dom mivolta egyben különbözo  borzati modellek. A pontossággal szembeni elvárások eltéro  hogy ami a telekommunikámintavételezési kritériumokat is jelent. Ezért fordulhat elo,  ció számára megfeleloen pontos domborzati modell, az az árvízvédelem számára teljesen használhatatlan.

714

16. Térinformatika

16.35. ábra. A

τ rácsállandójú Dirac-δ sorozattal mintavételezett felszín.

16.36. ábra. Egy település domborzati modelljének perspektivikus megjelenítése északi irányból. Az ábra színes változata az 816. oldalon látható.

715

16. Feladatok

Gyakorlatok 16.4-1. Hogyan célszeru  megválasztani a

τ mintavételi távolságot?

16.4-2. Elemezzük, hogy mit történik az adatrendszerrel és a spektrummal, ha teli távolságról áttérünk a

• •

τ2

τ1

mintavé-

mintavételi távolságra, abban az esetben, ha

τ1 < τ2 (ritkítás); τ1 > τ2 (surítés). 

Feladatok 16-1. A négy-fa további muveletei   oekben   muveletét. Az eloz felvázoltuk a pont-tartomány négy-fa egy lekérdezo  Készítsünk  lekérdezésekhez: hatékony algoritmust objektum törléséhez a fából, valamint a következo

a.

határozzuk meg egy P pont legközelebbi szomszédját, azaz azon objektumot, melynek  a legkisebb (NN-query), valamint távolsága P-tol

b.

határozzuk meg egy P pont legközelebbi k darab szomszédját, azaz a P-hez legközelebb  k darab objektumot (k-NN query). fekvo

16-2. Konvolúció RGB színkódok esetében A színes képek pontjainak RGB kódjait a K ´  ´ algoritmus összeadást és szorzást  használó muvelete  nem megfeleloen kezeli. Készítsük fel az algoritmust a színes képek kezelésére. 16-3. Konvolúció kiterjesztése a teljes képre A K ´  ´ algoritmus a bemeneti kép azon pontjait, melyekre nem tudja illeszteni a kernel középpontját, eldobja. Készítsük el az algoritmus olyan változatát, amely ezen hatá rolópontokhoz is rendel képpontokat a kimeneti képben. Gyakorlatban gyakran eloforduló megoldásnak számít a kernel által lefedett területek tükrözése vagy másolása a kép szélén  túli területre. Gondoljuk át a lehetséges megoldások elonyeit és hátrányait. 16-4. Zajszurés   Mindhárom véletlen Tegyük fel, hogy van három képünk pontosan ugyanarról a területrol.  zajjal fertozött. a.

Tegyünk több javaslatot a zaj csökkentésének módjára.

b.

Mi történik a képpel és a jel/zaj aránnyal, ha a három képet egyetlen képben összegezzük?

16-5. Csonkítás elemzése A sinc függvény, mint láthattuk, fontos szerepet játszik mind a szurések,  mind pedig a mintavételezés területén. Ideális esetben a frekvenciatartományban megkívánt – végtelenhez

716

16. Térinformatika

közeli – levágási meredekség miatt a sinc függvénynek nagyon hosszúnak kellene lennie, mivel a sinc csak lassan tart nullához. Ezért a magfüggvény viszonylag hosszú lesz, ami viszont hátrányos az eljárás futási idejének szempontjából. Ezért a sinc függvény helyett  annak csonkított változatát használják a gyakorlatban a szur  ok, és az újra-mintavételezés végrehajtásakor. A csonkító függvények általában valamiféle

harang-görbék”, amivel mó” dosítják a sinc függvényt. A módosított súlyfüggvény az eredeti súlyfüggvény és a csonkító függvény szorzata. Bizonyítsuk be a konvolúció azonosságai segítségével, hogy a legrosszabb eredményt adja az a csonkítás, amikor egyszeruen  elhagyjuk a magfüggvény széleit, vagyis ha a csonkító függvény a négyszög függvény.

Megjegyzések a fejezethez  Laurini [279], valamint Maguire és társai [304] könyvei részletesen tárgyalják a különbözo térinformatikai adatmodelleket. A centroid és a befoglaló négyszög fogalmát is bevezetik,  aminek jelentoségét [386] több helyen ki is fejti. Hatvany Csaba [195] és Stephens [438] grakus programozással foglalkozó muveikben  részletesen foglalkoznak a grakus adatok és a megjelenítés kérdéseivel. Rigaux és társai [386] elméleti alapmuvükben  részletesen foglalkoznak a térbeli indexelés problematikájával és összevetik a [90] tankönyvben is részletesen tárgyalt B-fa muködésével.  [294] és [386] összehasonlítják a grid index és a rekurzív térfelosztási algoritmusok hatékonyságát. A négy-fa és más kapcsolódó adatszerkezetek részletes elemzésével foglalkozik Samet [410] cikke. [279], [294] és [386] részletesen tárgyalják a négy-fa algoritmust, valamint ugyanitt olvashatunk a nyolc-fáról is. Szintén meg nem esett szó a fejezetben, de a gyakorlatban található ezen muvekben  az R-fa, melyrol  a B-fához sokszor használt adatszerkezet. Az R-fa a befoglaló négyszög fogalmára építo,   hasonló összetettebb keresofa, melyet tetszoleges dimenziószámú térben alkalmazhatunk. Hasznos tulajdonságai, hogy csúcsainak méretét az aktuális blokkmérethez igazíthatjuk, ki egyensúlyozott, valamint megfeleloen támogatja a gyakori lekérdezés-típusokat. A négy-fa és a nyolc-fa grakai alkalmazásával foglalkozik a 15.4. alfejezet. [195] és [438] a gyakorlati programozás oldaláról mutatják be az RGB színmodellt,  algoritmust, mint például az alul- és és több, a digitális szurési  technikában ismert szur  o    ok,    Richards felülvágó szur  ok, sávszur  ok, élmegorz élkiemelok, és sok más érdekes szur  ot. könyve [385] elméleti alapmu,  amely szélesköru  áttekintést nyújt az urfotók,  a távérzékelés  az észleléstol  a feldolgozáson át az értelmezésig. Duncan muvéb  [115] jó problémakörérol  ol  a Fourier-analízis. áttekintést kapunk a komplex függvénytanról, amely nélkül nem értheto  formában vezeti be az Olvasót a disztribúcióelmélet fogalmaiba. Tárgyalja a [93] értheto  Dirac-δ-t, a Heaviside-féle lépcsofüggvényt és sok más érdekességet, amely nélkül a jelfel [90], [321] és [322] részletesen isdolgozás és mintavételezés nehezen lenne megértheto. mertetik a Fourier-transzformációt, sok példával, alapos elméleti áttekintéssel. Meskó Attila  szurési  technikák, valamint tankönyveiben [321, 322] részletesen olvashatunk a különbözo  ezek gyakorlati alkalmazásáa mintavételezés elméleti alapjairól, a mintavételi törvényrol, ról.  Ákos és Szabó György [109, A térinformatikával foglalkozik magyar nyelven Detrekoi 110], Kertész Ádám [253], Márkus Béla [338], valamint Márton Mátyás és társai [340] könyve.

17. Tudományos számítások

A tudományos számítások cím egy kísérlet a nemzetközi szakirodalomban

Scientic ” Scientic Engineering”, Computational Science and Engineering” stb. ” ” névvel hivatkozott diszciplína magyar megnevezésére. Ezt a területet a matematika, Computing”,

a szoftverek és az alkalmazási területek közti interdiszciplináris területként is szokás jellemezni. Célja a számítógépek és matematikai algoritmusok – a hardvert is tekintetbe  – hatékony felhasználása tudományos és mérnöki problémák megoldására. A témakör vevo irodalmának tanulmányozása alapján – némi egyszerusítéssel  – azt mondhatjuk, hogy témánk valójában a numerikus matematika, a szoftverfejlesztés, az eredmények grakus megjelenítése (számítógépes graka) és a szakterületi alkalmazási ismeretek együttese. A  terjedelmi korlátokra és az ésszeruségre  tekintettel csak a kérdéskör néhány alapvetoen fontos elemét tárgyaljuk, amelyek a lebegopontos  aritmetika (17.1. alfejezet) és a hibae módszereire lemzés (17.2. alfejezet) alapjaira, a lineáris algebra (17.3. alfejezet) alapveto és a matematikai szoftverekre, szoftverkönyvtárakra (17.4. alfejezet) vonatkoznak.

17.1. Lebeg®pontos aritmetika és hibaelemzés 17.1.1. Hibaszámítási alapismeretek Legyen x a kiszámítandó pontos érték, a az x közelítése (a ≈ x). A közelítés hibáját a   érték abszolút ∆a = x − a képlettel deniáljuk (néha fordított elojellel). A δa-t az a közelíto hibakorlátjának (vagy röviden csak hibakorlátjának) nevezzük, ha fennáll | x − a| = |∆a| ≤ √ δa. Például a 2 ≈ 1.41 közelítés hibája legfeljebb 0.01, más szóval egy hibakorlátja 0.01. Az x és az a mennyiségek (és természetesen a ∆a, δa is) vektorok vagy mátrixok is lehetnek. Ilyenkor az abszolútérték és a relációs jelek komponensenként (mátrixelemenként)  értendok. A hiba nagyságának mérésére normát is használunk. Ez esetben a hibakorlát, ha fennáll

δa ∈ R akkor

k∆ak ≤ δa.

Az abszolút hibakorlát sok esetben semmitmondó. Például egy 0.05 abszolút hibakorlátú közelítés lehet egészen kiváló is, de egy 0.001 nagyságrendu  elméleti mennyiség becs hibakorláttal lésénél nem sokat ér. A becslés jóságát sokszor a relatív, azaz az egységre eso jellemezzük, ami

δa/ | x| (vektorok, mátrixok esetén δa/ k xk). Mivel az x pontos érték általáδa/ |a|, (illetve a δa/ kak) közelítést használjuk. Az így elkövetett

ban nem ismeretes, ezért a

hiba elhanyagolható, ha x és a abszolút értéke (normája) lényegesen nagyobb a másodrendu  2

(δa) mennyiségnél. A relatív hibát sokszor százalékokban fejezzük ki. Minthogy a hibát rendszerint nem ismerjük, ezért hibán gyakran a hibakorlátot értjük.  de ismert hiA klasszikus hibaszámítás alapmodelljében azt vizsgáljuk, hogy közelíto,

718

17. Tudományos számítások

bakorlátú bemeneti adatokkal pontosan végrehajtott számítások során mekkora a végeredmény hibakorlátja. Legyen x és y két pontos érték, a az x, b pedig az y közelítése. Tegyük fel, hogy az a és b közelítések abszolút hibakorlátai

δa,

ill.

δb.

A klasszikus hibaszámítás

 hibakorlátokat kapjuk: eszközeivel a négy alapmuveletre  a következo

( ) δ(a + b) δa δb (ab > 0) , δ (a + b) = δa + δb, = max , |a + b| |a| |b| δ(a − b) δa + δb (ab > 0) , = δ (a − b) = δa + δb, |a − b| |a − b| δ(ab) δa δb (ab , 0) , ≈ + δ (ab) ≈ |a| δb + |b| δa, |ab| |a| |b| δ(a/b) δa δb |a| δb + |b| δa (ab , 0) . δ(a/b) ≈ , ≈ + 2 |a/b| |a| |b| |b|

 látható, hogy nullához közeli számmal való osztás során az abszolút hiba, A képletekbol míg nullához közeli végeredményu  kivonás esetén a relatív hiba akármilyen naggyá válhat. Ezeket az eseteket kerülni kell. Különösen a kivonás lehet nagyon alattomos.

√ 17.1. példa. Számítsuk ki a

1996 −



√ 1995 mennyiséget, ha ismertek a

1996

≈ 44.67 és a

√ 1995



 értékek, amelyek közös abszolút hibakorlátja 0.01, a közös relatív hibakorlát pedig 44.66 közelíto 0.022%. A kivonás elvégzésével kapjuk, hogy  az általános képletbol



1996 −



1995

≈ 0.01, amelynek relatív hibakorlátja

0.01

+ 0.01 =2, 0.01  azaz 200%. Most lehetoségünk van a tényleges relatív hiba kiszámolására is, ami

csak” 10.66%. Ez ” 2  mértéku, a valóságos hiba is jelentos  a kiinduló adatok hibájához képest kb. 4.84 × 10 -szoros. A különbség képzését elkerülhetjük a





− 1995 1 1 = √ ≈ ≈ 0.01119 √ √ 89 .33 1996 + 1995 1996 + 1995  abszolút hibája 0.02, a hányados relatív hibája pedig átalakítással. A számláló pontos érték. A nevezo 0.02/89.33 ≈ 0.00022 = 0.022%. Ez összhangban van a kiinduló adatok relatív hibáival és lényegesen 1996



1995

= √

1996

kisebb, mint amit a közvetlen kivonásnál kaptunk.

 (elKétszer folytonosan differenciálható egy-, illetve többváltozós függvények közelíto   fokú Taylor-polinomjuk segítségével kapjuk: sorend u)  hibáit az elso

δ(f δ(f

≈ f 0 (a) δa, f : R → R , n X ∂ f (a) δai , f : Rn → R . (a)) ≈ ∂ xi (a))

i= 1

 az úgynevezett kondíFüggvények adott a pontbeli numerikus stabilitására jellemzo  függvényérték és a közelíto  bemeneti mennyiség relatív hibájának ciószám. Ez a közelíto hányadosa (F :

Rn → Rm

0

esetén F (a)-n az F függvény a

∈ Rn

mátrixát értjük):

| f 0 (a)| |a| , | f (a)| kak kF 0 (a)k c(F, a) = , kF(a)k c( f , a)

=

f :

R→R,

F :

Rn → Rm .

helyen számított Jacobi-

719

17.1. Lebegopontos  aritmetika és hibaelemzés

17.1. ábra. Direkt hiba és inverz hiba.

 ennyiszeresre no  a A kondíciószám tehát a relatív hiba nagyítási számának tekintheto:  bemeneti relatív hiba a függvényérték kiszámítása során. Ennek megfeleloen a függvényünk numerikusan stabil, más néven jól kondicionált az a helyen, ha c( f , a) kicsi, egyébként  Egy függvény numerikusan instabil (rosszul kondicionált). A kondicionáltság helyfüggo. lehet valamely a helyen jól, míg ugyanaz a függvény egy b helyen rosszul kondicionált. Természetesen a c( f , a)-ra vonatkozó

 relatív. Mint késobb  kicsi” jelzo látni fogjuk, ez a re”  adott feladat esetén a rendelkezésre álló számítógép aritmetikájától és a közelítés latív jelzo megkövetelt pontosságától függ.  korlátját vezethetjük Mátrixok kondíciószámát is mint függvény kondíciószám felso

Rn → Rn leképezést az Ay = x egyenletrendszer megoldásával, azaz legyen F(x) = ∈ Rn×n , det(A) , 0). Ekkor F 0 ≡ A−1 és





−1

kak

A−1

kAyk

A−1

(Ay = a) . c(F, a) = ≤ Ak A = k

A−1 a

kyk be. Deniáljuk az F :

−1 A x (A

 korlátot az A mátrix kondíciószámának A jobboldali felso hívjuk. Ez a korlát pontos,

mert létezik olyan a

∈ Rn , hogy c(F, a) = kAk

A−1

.

17.1.2. Direkt és inverz hibák Vizsgáljuk egy f (x) függvényérték kiszámítását. Ha az y ˆ közelítést számoljuk a pontos

= f (x) érték helyett, akkor a direkt hiba ∆y = yˆ − y. Ha egy x + ∆ x értékre fennáll, hogy = f (x + ∆ x), azaz yˆ a perturbált (megváltoztatott) xˆ = x + ∆ x értékhez tartozó pontos függvényérték, akkor a ∆ x értéket inverz hibának nevezzük. A kétfajta hibát mutatja a 17.1.

y y ˆ

ábra. A folytonos vonal az elméleti értéket, a szaggatott pedig a számított értéket jelöli. Az inverz hiba elemzését és becslését inverz hibaanalízisnek nevezzük. Ha több inverz hiba is létezik, akkor a legkisebb inverz hiba meghatározása az érdekes. Az y

=

f (x) értéket számító algoritmust inverz stabilnak nevezzük, ha bármely x ér-

tékre olyan y ˆ számított értéket ad, amelyre a

∆x

inverz hiba kicsi. A

 zetfüggo.

 környekicsi” jelzo ”

A direkt és az inverz hiba kapcsolatát a hibaszámítási ökölszabálynak is nevezett

δyˆ δ xˆ ≤ c ( f , x) |y| | x|  egyenlotlenség  közelíto fejezi ki. Szavakban megfogalmazva: relatív direkt hiba

≤ kondíciószám × relatív inverz hiba.

(17.1)

720

17. Tudományos számítások

 Az egyenlotlenség azt mutatja, hogy egy rosszul kondicionált probléma számított megoldásának nagy lehet a (relatív) direkt hibája. Egy algoritmust direkt stabilnak nevezünk, ha a direkt hiba kicsi. Egy direkt stabil módszer nem feltétlenül inverz stabil. Ha az inverz hiba és a kondíciószám kicsi, akkor az algoritmus direkt stabil.

= log x függvényt. Ennek kondíciószáma c ( f , x) = c (x) = 1/ log x , x ≈ 1 esetén nagy. Tehát az x ≈ 1 értékekre a relatív direkt hiba nagy lesz.

17.2. példa. Vizsgáljuk az f (x) amely

17.1.3. Kerekítési hibák és hatásuk a lebeg®pontos aritmetikában A hibaszámítás klasszikus felfogásában csak a bemeneti adatok hibáiból származó, úgynevezett öröklött hibákat vizsgáljuk. A digitális számítógépek a számokat véges sok számjeggyel ábrázolják, így egy F véges számhalmaz elemeivel hajtják végre az aritmetikai mu veleteket és ezek eredményeit is az F elemei közül kell kiválasztaniuk. Tehát már a bemeneti  hibái is módosulnak az ábrázolásuk során, majd minden egyes muveadatok eleve meglévo  let eredménye további torzulást szenvedhet. Ha a muvelet  eredménye az F halmazbeli szám, akkor a muvelet  eredményét pontosan kapjuk meg. Egyébként pedig három eset léphet fel:



kerekítés ábrázolható (nemnulla) számhoz;



alulcsordulás (kerekítés 0-hoz);



túlcsordulás (ábrázolhatatlanul nagy abszolút értéku  eredmény esetén).

A tudományos-muszaki  számítások zömét ún. lebegopontos  aritmetikában végezzük. Ennek  legáltalánosabban elfogadott modellje a következo.  17.1. deníció (a lebegopontos számok halmaza).

F(β, t, L, U )

( = ± m × βe |

1

β

≤ m < 1,

m

= 0.d1 d2 . . . dt ,

L

) ≤ e ≤ U ∪ {0} ,

ahol



β a számrendszer alapja;



m a lebegopontos  szám mantisszája a



e az ábrázolt szám kitevoje  (karakterisztikája, exponense);



t a mantissza hossza (az aritmetika pontossága);



L a legkisebb kitevo  (alulcsordulási határ kitevoje); 



U a legnagyobb kitevo  (túlcsordulási határ kitevoje). 

β alapú számrendszerben;

A három leggyakrabban használt számrendszert táblázatban foglaltuk össze. elnevezés

β

felhasználás

bináris

2

legtöbb számítógép

decimális

10

legtöbb számológép

hexadecimális

16

IBM és hasonló nagyszámítógépek

(17.2)

721

17.1. Lebegopontos  aritmetika és hibaelemzés

A mantisszát felírhatjuk az m

d1

= 0.d1 d2 . . . dt =

β

+

d2

+ ··· +

β2

dt

(17.3)

βt

alakban is. Innen látható, hogy az 1/β

≤ m < 1 feltétel miatt az elso jegyre teljesülnie  ≤ β − 1 egyenlotlenségnek. A többi számjegyre fennáll, hogy 0 ≤ di ≤ β − 1 (i = 2, . . . , t). Az ilyen számrendszereket normalizáltaknak nevezzük. A 0 jegyet és  jegy csak az a tizedespontot értelemszeruen  nem szokás ábrázolni. Ha β = 2, akkor az elso 1 lehet, amelyet szintén nem ábrázolnak. A (17.3) felírást használva az F = F(β, t, L, U ) ≤

kell az 1

d1

halmazt megadhatjuk az

F

alakban is, ahol 0 17.3. példa. A

( = ±

d1

β

+

d2

β2

+ ··· +

dt

! βe |

βt

L

) ≤ e ≤ U ∪ {0}

(17.4)

≤ di ≤ β − 1 (i = 1, . . . , t) és 1 ≤ d1 .

β = 2, t = 3, L = −1 és U = 2 esetén a 33 elemu F halmaz pozitív része ( ) 1 5 6 7 1 5 6 7 10 12 14 20 28 . , , , , , , , , 1, , , , 2, , 3, 4

16

16

16

2

8

8

8

8

8

8

8

8





Az F halmaz elemei nem egyenletesen helyezkednek el a számegyenesen. Az 1/β, 1  F-beli szomszédos számok távolsága intervallumba eso a

±m × β

e

β−t . Minthogy az F halmaz elemeit

számok alkotják, a szomszédos F-beli számok távolsága az exponens értékének

 megfeleloen változik. A szomszédos elemek legnagyobb távolsága

β

L −t

. A

β alapú számrendszerben m ∈ 1

β

≤m=

d1

β

+

d2

β

2

+ ··· +



1/β, 1

dt

β

t



βU −t , a legkisebb pedig

 − 1/βt , ugyanis

β−1 β−1 β−1 1 + 2 + ··· + =1− t . t β β β β

Fenti összefüggés segítségével könnyen igazolható az ábrázolható számok nagyság következo  tétel. rendjét jellemzo 17.2. tétel. Ha a



F, a

, 0, akkor ML

Legyen a, b



F és jelölje

ML

≤ |a| ≤

= β L −1 , 

MU

MU , ahol

= βU (1 − β−t ) .

a négy aritmetikai muvelet  (+, −, ∗, /) bármelyikét. A

 esetek lehetségesek: következo (1) ab (2) (3) (4)

∈ F (pontos eredmény), |ab| > MU (aritmetikai túlcsordulás), 0 < |ab| < ML (aritmetikai alulcsordulás), ab < F, ML < |ab| < MU (nem ábrázolható eredmény).

Az utolsó két esetben a lebegopontos  aritmetika az ab eredményhez hozzárendeli a  egyforlegközelebbi F-beli számot. Ha két szomszédos F-beli szám az ab eredménytol mán távol van, akkor általában a nagyobbik számhoz kerekítünk. Például ötjegyu  decimális

722

17. Tudományos számítások

aritmetika esetén a 2.6457513 számot a 2.6458 számhoz kerekítjük. Legyen G

= [− Mu , Mu ].

| x −  (x)|



Világos, hogy F



rendelt F-beli számot jelölje  (x). Az x

G. Legyen x



G. A kerekítéssel x-hez

 (x) leképezést kerekítésnek nevezzük, az

mennyiséget pedig kerekítési hibának. Világos, hogy ha  (x)

rekítési hiba legfeljebb

β1−t /2.

= β1−t /2

Ezért az u

=

1, akkor a ke-

mennyiséget az egységnyi kerekítés

mértékének nevezzük. Az u az (x) relatív hibakorlátja. Igaz ugyanis a 17.3. tétel. Ha x

∈ G, akkor (x)

=

x(1

+ ε),

|ε| ≤ u .

Bizonyítás. Az általánosság megszorítása nélkül feltehetjük, hogy x

>

0. Legyen az x szá-

mot közrefogó két szomszédos F-beli szám m1 β és m2 β . Ekkor tehát e

m1 β

m2

− m1



x

≤ m2 βe ,

− β−t = m1 < m2 = 1 fennáll. Minthogy = β mindkét esetben teljesül, akár az  (x) = m1 βe , akár az  (x) = m2 βe kerekítés

és vagy 1/β



−t

m1

<

m2



1

− β−t ,

e

e

vagy 1

következik be, igaz, hogy

| (x) − x| ≤

|m2 − m1 | 2

βe =

βe−t 2

.

 következik Ebbol

βe−t β− t | (x) − x| | (x) − x| ≤ ≤ = ≤ m1 βe 2m1 βe 2m1 | x| Fennáll tehát, hogy  (x)

2

β1−t = u .

− x = λ xu, ahol |λ| ≤ 1. Ezt átrendezve kapjuk, hogy  (x)

Mivel

1

=

x(1

+ λu) .

|λu| ≤ u, az ε = λu jelöléssel megkaptuk a tétel állítását.

 A tétel tulajdonképpen azt mondja ki, hogy a lebegopontos aritmetikában a kerekítés relatív hibája korlátos és ez a korlát u, az egységnyi kerekítés mértéke. A kerekítés pontosságának jellemzésére az u kétszeresét szokás használni. Az 2u

= β1−t

értéket szokás gépi epszilonnak is nevezni. Az

M

M =

az 1 és a hozzá legközelebbi

 algoritmussal határozhatjuk 1-nél nagyobb szám távolsága. Bináris alap esetén a következo meg

M

értékét.

G´ -

←1

1

x

2

while 1

3 4 5

+x>1 ← x/2

do x

 M ← 2x return  M

723

17.1. Lebegopontos  aritmetika és hibaelemzés

 M ≈ 2.2204 × 10−16 .

A MATLAB rendszerben

  feltevésA lebegopontos aritmetikai muveletek  eredményére vonatkozóan a következo sel élünk (szabvány modell): (ab)

= (ab) (1 + ε) ,

|ε| ≤ u

(a, b



F)

.

(17.5)

 Az IEEE aritmetikai szabvány, amelyet késobb ismertetünk, kielégíti ezt a feltevést. A feltevés fontos következménye, hogy ab teljesül, hogy

, 0 esetén a muveletek  relatív hibájára ugyancsak

|(ab) − (ab)| ≤u. |ab|

Tehát az aritmetikai muveletek  relatív hibája kicsi.  Vannak bizonyos lebegopontos aritmetikák, amelyek nem elégítik ki a (17.5) feltevést.  o  jegyük. Ennek az az oka, hogy a kivonásnál nincs egy ún. ellenorz

− 0.111 különbséget háromjegyu bináris arit-

Az egyszeruség  kedvéért vizsgáljuk az 1

 lépésben a kitevoket  metikában. Az elso azonos értékre hozzuk

× ×

2



2

. .

0 0

1

0

0

0

1

1

.

1

Ha a számítást négy értékes jegyre végezzük, akkor az eredmény

× × ×

1

2



1

2

1

2

−2

 a normalizált eredmény 2 amelybol

. . .

0 0 0

1

0

0

0

1

1

1

0

0

0

1

,

× 0.100. Vegyük észre, hogy a kivonásra került szám

 jegye 0. A felhasznált ideiglenes negyedik mantisszajegyet elnem normalizált, mert elso  o  jegynek nevezzük. Ha nincs ilyen ellenorz  o  jegy, akkor a megfelelo  számítások a lenorz  következoképpen alakulnak: 1

2



1

2

1

2

−1

így a normalizált eredmény 2

× × ×

0 0 0

. . .

1

0

0

0

1

1

0

0

1

,

 o  jegye a · 0.100. Ennek relatív hibája 100%. Nincs ellenorz

CRAY szuperszámítógépeknek, valamint egy sor zsebkalkulátornak.  o  jegy, akkor a muveletek Ha nincs ellenorz  eredményeire az  (x

± y) = x (1 + α) ± y (1 + β) , |α| , |β| ≤ u , = (xy) (1 + δ) , |δ| ≤ u,  = ∗, /

 (xy)

(17.6) (17.7)

összefüggések teljesülnek.  o  jegy a kivonásnál és teljesül a (17.5) Tegyük fel a továbbiakban, hogy van ellenorz  jelöléseket: feltevés. Vezessük be a következo

|z| = [|z1 | , . . . , |zn |]T (z ∈ Rn ) , h im,n  m×n A ∈ R , |A| = ai j i, j=1

(17.8) (17.9)

724

17. Tudományos számítások

A



B

⇔ ai j ≤ bi j

A, B

 ∈ Rm×n .

(17.10)

Igazolhatók az alábbi eredmények, ahol E az aktuális muvelet  hibáját (hibamátrixát) jelöli:

   xT y − xT y ≤ 1.01nu | x|T |y|  (α A)

= αA + E

(| E |

(nu

≤ 0.01) ,

(17.11)

≤ u |αA|) ,

(17.12)

+ B) = (A + B) + E (|E | ≤ u |A + B|) ,     (AB) = AB + E |E | ≤ nu |A| | B| + O u2 .  (A

(17.13) (17.14)

 lebegopontos A szabvány modellnek eleget tevo  aritmetikáknak számos sajátos tulajdonsága van. Fontos tulajdonságuk, hogy az összeadás a kerekítés miatt nem asszociatív.  példa. Ezt mutatja a következo 17.4. példa. Ha a

= 1, b = c = 3 · 10−16 , akkor a MATLAB rendszerben AT386 számítógépen

1.000000000000000e

+ 000 = (a + b) + c , a + (b + c) = 1.000000000000001e + 000 .

Pentium1 100MHz-es processzorú gépen a b

= c = 1.15 × 10−16

választás ad hasonló eredményt.

 (numerikus) processzorok esetén azonos számítáA példa azt is is mutatja, hogy eltéro  lehetnek. Nagyszámú adat összegzésénél a kommutativitással sok eredményei különbözok (tulajdonképpen asszociativitással) is probléma lehet. Vizsgáljuk most a

Pn

i= 1

xi összeg ki-

számítását. A természetes algoritmus az ún. rekurzív összegzés: R´- ´ (n, x) ¨

←0 ← 1 to n do s ← s + xi

1

s

2

for i

3 4

return s

17.5. példa. Számítsuk ki az sn

=1+

n X

i=1

összeget n

1 i2

+i

= 4999 esetén. A rekurzív összegzéssel kapott MATLAB eredmény 1.999800000000002e

+ 000 .

 sorrendben végezzük, akkor az eredmény Ha az összegzést fordított (azaz nagyság szerint növekedo 1.999800000000000e

+ 000 .

Ha a kétféleképpen kapott értékeket összevetjük az elméleti sn

=

2

− 1/(n +

1) összeggel, akkor

láthatjuk, hogy a második összegzés adott pontos eredményt. Ennek magyarázata az, hogy amikor a  eredményben. kisebb tagokkal kezdjük, akkor ezek összegei értékes jegyeket érnek a végso

  szám nagy pontosságú összeaNagy mennyiségu,  elojelben és nagyságrendben eltéro  algoritmus, amely az egyik legérdekesebb ilyen dása nem egyszeru  feladat. A következo

725

17.1. Lebegopontos  aritmetika és hibaelemzés

célra kifejlesztett eljárás, W. Kahantól származik. K ´ (n, x) ´ - ¨

7

←0 ←0 for i ← 1 to n do t ← s y ← xi + e s ← t+y e ← (t − s) + y

8

return s

1 2 3 4 5 6

s

e

17.1.4. A lebeg®pontos aritmetikai szabvány Az ANSI/IEEE Std 754-1985 bináris (β

=

2) lebegopontosó  aritmetikai szabványt 1985-

 lebegopontos  ben hozták nyilvánosságra. A szabvány specikálja az alapveto muveleteket,  összehasonlításokat, kerekítési módokat, az aritmetikai kivételeket és kezelésüket, valamint  aritmetikai formák közti konverziót. A négyzetgyökvonás az alapveto  muvelea különbözo  tek közé tartozik. A szabvány nem mond semmit az exponenciális és transzcendens függ vényekrol.  lebegopontos  A szabvány két fo formátumot ismer: az egyszeres és a dupla pontosságút. típus

méret

mantissza

e

u

egyszeres

32 bit

23

8 bit

2

dupla

64 bit

+ 1 bit 52 + 1 bit

11 bit

2

−24 −53

≈ 5.96 × 10−8 ≈ 1.11 × 10−16

[ML , Mu ]



±38

10

±308

10

  Mindkét formátumban egy bitet az elojelnek tartanak fenn. Minthogy a lebegopontos szá jegy mindig 1, ez a jegy nincs tárolva. A mantisszában mok normalizálva vannak és az elso  szereplo

+1 ezt a rejtett bitet jelzi.

  aritmetikai kivéA szabvány eloírja a nem F-beli vagy F-beli számra nem kerekítheto telek kezelését is. kivétel típusa

példa

érvénytelen muvelet 

0/0, 0

√ −1

túlcsordulás

× ∞, | xy| > Mu

osztás nullával

véges nemnulla/0

alulcsordulás

0

(Szubnormális számok a

±m · βL−t ,

< | xy| < 0

<

m

ML

< βt−1

 eloírt eredmény NaN (Not a Number)

±∞ ±∞ szubnormális számok alakú számok.) Az IEEE aritmetika

zárt rendszer. Minden aritmetikai muveletnek  van matematikailag értelmes vagy értelmet len eredménye. A kivételes muveletek  esetén jelzést ad ki, amely után a számításokat eloírásszeruen  folytatja. Az IEEE aritmetikai szabvány kielégíti a (17.5) modellt. Az IEEE szabvány hardver megvalósításai közül ki kell emelni az Intel 80x87 matematikai koprocesszorokat, a 80486 és a Pentium processzorokat, a DEC Alpha, a HP (Precision Architecture), az IBM RS/6000, az INMOS T800 és T900 processzorokat, a Motorola (680x0) és Sun (SPARCstation) processzorokat, valamint a HP tudományos kalkulátorait.

726

17. Tudományos számítások

Megjegyzés. Egyszeres pontosság esetén a mantissza hossza kb. 7 értékes jegyet enged meg a tízes számrendszerbe átszámolva. Ugyanez dupla pontosság esetén kb. 16 értékes jegyet jelent. Létezik még egy 80 biten ábrázolt, ún. kiterjesztett pontosság is, ahol t

=

63,

 pedig 15 bites. a kitevo

Gyakorlatok

 értékeket kaptuk: R1 = Két ellenállást muszerrel  megmértünk és a következo ± 0.3Ω, R2 = 65.6 ± 0.2Ω. A párhuzamos kapcsolással kapott eredo ellenállást az ismert Re = R1 R2 /(R1 + R2 ) képlettel számoljuk. Határozzuk meg a bemeneti adatok relatív  ellenállás Re közelíto  értékét. Számítsuk ki a közelíto  érték δRe hibakorlátjait és az eredo abszolút és δRe /Re relatív hibakorlátját háromféleképpen is: (i) a bemeneti adatoknak csak az abszolút korlátjait használva a δRe -t és ezután a δRe /Re

17.1-1. 110.2

relatív korlátot; (ii) a bemeneti adatoknak csak a relatív korlátjait használva a ezután a

δRe /Re relatív korlátot és

δRe abszolút korlátot;

 ellenállást Re (iii) az eredo



17.1-2. Tegyük fel, hogy

=

F(R1 , R2 ) kétváltozós függvényként tekintve.

−8

2 -t 10

hibakorláttal tudjuk kiszámítani. Melyik kifejezést le-

 het kisebb relatív hibával kiszámítani és hányszor kisebbel az alábbi két, elméletileg egyenlo két kifejezés közül:



√ 6 2 ; √ (ii) 99 − 70 2. (i) 1/ 1

+

Magyarázzuk is meg, miért. 17.1-3. Tekintsük az alapmuveleteket  kétváltozós függvényeknek, azaz f (x, y)

= xy, ahol

 a +, −, ∗, / muveletek  valamelyike. (i) Vezessük le az alapmuveletek  hibakorlátjait, mint kétváltozós függvényekét. (ii) Adjuk meg ezen függvények kondíciószámát. Mikor rosszul kondicionáltak ezek a függvények?  pontos értéknek (iii) Vezessünk le hibakorlátot a hatványozásra, úgy is, hogy a kitevot  hibával terhelt. tekintjük és úgy is, hogy mind az alap, mind a kitevo

= 16x2 és x ≈ a. A másodrendu hibatagot is gyelembe véve adjuk meg x 2 függvényében az a legnagyobb és legkisebb értékét úgy, hogy az y ≈ b = 16a közelítéssel számolva b relatív hibakorlátja legfeljebb 0.01 legyen. √ 2  17.1-4. A C = exp(4π / 83) (= 76.1967868 . . .) számot 24 bit hosszúságú lebegopontos (iv) Legyen y

aritmetikában számoljuk ki. (Az exponenciális függvényt is 24 értékes bittel adja a számítógépünk.) Becsüljük meg az eredmény abszolút hibáját. Adjuk meg a relatív hibát is a C konkrét értékének felhasználása nélkül. 17.1-5. Tekintsünk egy F(β, t, L, U ) lebegopontos  számhalmazt. (i) Mutassuk meg, hogy bármelyik aritmetikai alapmuvelet  eredményezhet aritmetikai túlcsordulást. (ii) Mutassuk meg, hogy bármelyik muvelet  okozhat alulcsordulást is.  kifejezések numerikusan instabilak x 17.1-6. Mutassuk meg, hogy a következo

≈ 0 esetén:

− cos x)/ sin2 x; (ii) sin(100π + x) − sin(x); −x (iii) 2 − sin x − cos x − e . (i) (1

Számítsuk ki a fenti kifejezések értékét x

= 10−3 , 10−5 , 10−7

esetén és becsüljük meg a

727

17.2. Lineáris egyenletrendszerek

hibát. Alakítsuk át a kifejezéseket numerikusan stabillá. 17.1-7. Hány eleme van az F

=

F (β, t, L, U ) halmaznak? Ezek között hány szubnormális

szám található? 17.1-8. Ismert, hogy nemnegatív x és y mellett a számtani közép nem kisebb a mértaninál, azaz (x + y)/2





 xy,és az egyenloség csak x

= y esetén áll fenn. Így van-e ez numerikusan

 is? Ellenorizzük kísérletileg az állítást, ha x és y nagyságrendje azonosan igen kicsiny, illetve   nagyságrendu igen nagy, valamint jelentosen eltéro  x és y esetén is.

17.2. Lineáris egyenletrendszerek A lineáris egyenletrendszerek általános alakja m egyenlet és n ismeretlen esetén: a11 x1

+ · · · + a1 j x j + · · · + a1n xn

= .. .

b1

ai1 x1

+ · · · + ai j x j + · · · + ain xn

= .. .

bi

+ · · · + am j x j + · · · + amn xn

=

bm

am1 x1

(17.15)

.

Az egyenletrendszert megadhatjuk a tömörebb Ax formában is, ahol A Ha m

=

h ai j

im,n i, j=1

=b

∈ Rm×n ,

x

(17.16)

∈ Rn ,

b

∈ Rm .

< n, akkor az egyenletrendszert alulhatározottnak nevezzük. Ha m > n, akkor túlhatá= n esetben az egyenletrendszert négyzetesnek

 beszélünk. Az m rozott egyenletrendszerrol

nevezzük. Itt csak a négyzetes egyenletrendszerekkel foglalkozunk és feltesszük, hogy az

−1

A

inverz mátrix létezik (ekvivalens feltétellel: det(A)

, 0). Ebben az esetben az egyenlet-

rendszernek egyértelmu  megoldása van.

17.2.1. Lineáris egyenletrendszerek megoldásának közvetlen módszerei Ebben a pontban a Gauss- és Cholesky-módszert, valamint az LU-felbontást mutatjuk be. Háromszögmátrixú egyenletrendszerek

17.4. deníció. Az A ai j

=

[ai j ]

n i, j=1

mátrix felso  háromszög alakú, ha minden i

= 0. Ha pedig az ai j = 0 minden i <

>

j esetén

j esetén teljesül, akkor alsó háromszög alakú.

 háromszögmátrixok alakja sematikusan a következo:  Például a felso

728

17. Tudományos számítások

17.2. ábra. Gauss-elimináció.

         





···

0

∗ .. .

..

.. . .. .

..

···

0

       .   ∗  ∗

···

∗ .. . .. .

.

. ···

∗ 0

 háromszögmátrixok. Megjegyzés. A diagonálmátrixok egyidejuleg  alsó és felso  háromszögmátrixok esetén det(A) Igazolható, hogy alsó vagy felso

=

a11 a22

. . . ann . A

háromszögmátrixú egyenletrendszerek megoldása igen egyszeru.  Tekintsük az a11 x1 +

··· .. .

+a1i xi + .. .

···

aii xi +

··· .. .

+a1n xn .. .

=

+ain xn .. .

=

ann xn

=

b1

.. .

bi

.. .

bn

 háromszögmátrixú egyenletrendszert. Ennek megoldását a következo,  ún. visszahefelso lyettesíto  algoritmus adja: V´ ´ (A, b, n)

← bn /ann ← n − 1 downto 1 Pn ai j x j )/aii do xi ← (bi − j=i+1

1

xn

2

for i

3 4

return x

Az alsó háromszögmátrixú egyenletrendszer megoldása hasonló. A Gauss-módszer A Gauss-féle eliminációs módszer (lásd 17.2) két fázisból áll: I. Azonos átalakításokkal az Ax

= b egyenletrendszert felso háromszög alakúra hozzuk.

háromszög alakúra hozzuk. (A 17.2 ábra sematikusan mutatja, hogy a teli együtthatómátrixú ˆ egyenletrendszert hozunk létre, amelynek ˆ × x  olyan A A × x = b egyenletrendszerbol ˆ = b ˆ együtthatómátrixa már felso  háromszögmátrix.) az A  háromszögmátrixú egyenletrendszert a visszahelyettesíto II. A kapott felso  algoritmus háromszög alakra hozás során az együtthatómátrix foátló  sal megoldjuk. A felso alatti ele-

729

17.2. Lineáris egyenletrendszerek

meit az egyenletrendszer ekvivalens átalakításával használjuk fel, hogy alkalmasan megválasztott egy másik, pl. k-adik egyenlet

γ-szorosát

γ

nullázzuk”. Ehhez azt az észrevételt ”  konstanssal valamely i-edik egyenletbol

 az egyik ismeretkivonva, az i-edik egyenletbol

len kiiktatható (eliminálható), miközben az egyenletrendszer megoldása természetesen nem változik.  (k Tegyük fel, hogy az elso a11 x1 +

··· .. .

− 1) oszlopban a nullázást már elvégeztük és az · · · +a1k xk .. . .. .. . .

+ ···

+

a1n xn

=

akn xn

=

ain xn

=

ann xn

=

.. . .. .

akk xk

+ ···

aik xk

+ ···

ank xk

+ ···

+

.. .

.. . .. .

.. .

+

.. .

bk

.. .

.. .

+

b1

bi

.. .

bn

, 0, akkor az akk alatti xk együtthatókat az i-edik sorból a γ = aik /akk -szorosa kivonásával nullázhatjuk ki. Ugyanis az

egyenletrendszert kaptuk. Ha akk k-adik sor

(aik

− γakk )xk + (ai,k+1 − γak,k+1 )xk+1 + · · · + (ain − γakn )xn = bi − γbk

 γ-val éppen a kívánt aik − γakk = 0 adódik. Ezt az eloírást végre= 1, 2, . . . , n − 1 oszlopok és egy-egy oszlopon belül az i = k + 1, . . . , n sorszámú     sorok mindegyikére, kialakul a felsoháromszög mátrix. A következokben A i, j az A mát   o  szeletét rix ai j elemét, az A i, j : n pedig a mátrix i-edik sorának a j-edik oszloptól kezdod egyenletben a választott hajtva a k

jelöli. Ezzel az egyenletrendszert megoldó algoritmus (az algoritmusban már itt feltüntettük  pontban tárgyalt pivotálás helyét is): a következo G- (A, b) ´ 0 1 2 3

B I. (eliminációs) fázis. n ← sorok[A] for k ← 1 to n − 1  do {pivotálás esetén foelemkiválasztás, majd sor-, illetve oszlopcsere}

8

← k + 1 to n γik ← A [i, k] /A [k, k] A [i, k + 1 : n] ← A [i, k + 1 : n] − γik ∗ A [k, k + 1 : n] bi ← bi − γbk  fázis: lásd a V´ B II. (visszahelyettesíto) ´  algoritmust.

9

return x

4 5 6 7

for i

do

Az algoritmus felülírja az eredeti mátrix és a jobboldali vektor elemeit, ugyanakkor a  foátló alatti nullákat nem írja be. A nullák beírása egyrészt felesleges lenne, hisz azokra  az elemekre a II. fázis nem hivatkozik. Ugyanakkor a nullák helyén a késobb tárgyalandó  LU -felbontáshoz szükséges információkat orizhetjük meg. A Gauss-módszert természetesen csak akkor lehet végrehajtani, ha a mindenkori akk

730

17. Tudományos számítások

  elem nem nulla. Emiatt is, de foként a numerikus stabilitás miatt a módszert foelemkiválasztással szoktuk alkalmazni.  A foelemkiválasztásos Gauss-módszer Amennyiben az akk elem nulla, az eliminációs eljárást megkísérelhetjük úgy folytatni, hogy  elem kerüljön. Amennyiben ez sem lehetsorcserével a (k, k) pozícióra nullától különbözo séges, mert az akk , ak+1,k , . . . , ank mindegyike nulla, akkor az együtthatómátrix determinánsa nulla, egyértelmu  megoldás nem is létezik. Az akk elemet k-adik pivotelemnek nevezzük. A sorok felcserélésével új pivot elem választható. A pivot elem megválasztása nagymértékben befolyásolja az eredmények megbízhatóságát. Már csak amiatt is, hogy osztunk vele, amely  négyzetével fordítva arányos. A lehetoség  muvelet  hibája – mint korábban láttuk – a nevezo  szerinti minél nagyobb abszolút értéku  pivot elem választás az elonyös. Az ilyen választást pivotálási, vagy foelemkiválasztási  eljárásnak nevezzük. Kétféle pivotálási stratégiát említünk meg.  Részleges foelemkiválasztás: A k-adik lépésben a k-adik oszlop a jk (k

≤ j ≤ n) elemei

közül kiválasztjuk a maximális abszolút értékut.  Ha ennek indexe i, akkor a k-adik és az i-edik sort felcseréljük. A pivotálás után teljesül, hogy

|akk | = max |aik | . k≤i≤n

 Teljes foelemkiválasztás : A k-adik lépésben az ai j (k

≤ i, j ≤

n) mátrixelemek közül

kiválasztjuk a maximális abszolút értékut.  Ha ennek indexe (i, j), akkor a k-adik és az i-edik sort, valamint a k-adik oszlopot és j-edik oszlopot felcseréljük. A pivotálás után teljesül, hogy

|akk | =



.

max ai j

k≤i, j≤n

Megjegyezzük, hogy oszlopcsere esetén változócsere is történik.   Jól illusztrálja a pivotálás jelentoségét a következo 17.6. példa.

−17

10

x

x

+ +

y y

= =

1 2

, .

= 1/(1 − 10−17 ), y = 1 − 10−17 /(1 − 10−17 ). A MATLAB szerinti számábrázolásában (x) = (y) = 1, vagyis ennél jobb közelítést a érhetünk el. Pivotálás nélküli Gauss-módszerrel megoldva az x = 0, y = 1

Ezen egyenletrendszer pontos megoldása: x duplapontos szabvány MATLAB-ban nem is

 katasztrofálisan hibás eredmény adódik, míg részleges foelemkiválasztással megkapjuk az elméletileg  legjobb, azaz x elérheto

= y = 1 közelíto megoldást.

17.5. megjegyzés. Nem kell végrehajtani foelemkiválasztást  a következo  esetekben: 1. Ha A szimmetrikus és pozitív denit (A x

, 0)

∈ Rn×n

pozitív denit



T

x Ax

>

0,

∀ x ∈ Rn ,

.

2. Ha A diagonálisan domináns a következo  értelemben:

|aii | >

X a ij

(1

≤ i ≤ n) .

j,i

Szimmetrikus és pozitív denit A mátrix esetén a Gauss-elimináció egy késobb  ismertetendo  speciális alakját, a Cholesky-módszert használjuk az egyenletrendszer megoldására.

731

17.2. Lineáris egyenletrendszerek

 együttható mátrixú egyenletA Gauss-elimináció során valójában egymástól különbözo rendszereket kapunk (habár a közölt algoritmus szerint a számítógép zikailag egy helyen tárolja valamennyit és az alsó háromszög részbe nem is írja be a nullákat), azaz az A

(0)

x

= b(0) →

A

(1)

= b(1) → · · · →

x

(n−1)

A

x

= b(n−1)

 álló sorozatot, ahol ekvivalens egyenletrendszerekbol A

(k)

=

h

(k)

ai j

in

.

i, j=1

Az eliminációs fázis végén az

A

mátrix alakul ki, ahol a

(k−1) kk

(n−1)

    =   

(0)

(0)

0

a

··· ··· .. .

0

···

···

a

11

a

12 (1) 22

.. .

ann

a

1n (1) 2n

.. .

(n−1)

      

 vagy pivotelem. A pivotelemek növekedési tényea k-adik fo-,

zoje: 

ρ = ρn = Igen fontos kérdés a

(0)

a



(k−1)

max a

kk

1≤k≤n

. /a(0) 11

ρ növekedési tényezo nagyságrendje, mert ez összefüggésben áll az el-

 megoldás hibája arányos járás numerikus stabilitásával. Wilkinson igazolta, hogy a közelíto a

  ρ növekedési tényezovel, amelyre teljes foelemkiválasztás esetén a

ρ≤

√ 

n 2

1

· 3 ···n 2

1

n−1



1 2

∼ cn

1 2

1

n4

log(n)

,

 részleges foelemkiválasztás esetén pedig a

ρ ≤ 2n−1  korlát teljesül. Wilkinson azt sejtette, hogy teljes foelemkiválasztás esetén

ρ≤

n . Ezt kis

≤ ρ nagyságrendje átlagosan Θ n2/3 a részleges és Θ n1/2 a teljes   foelemkiválasztás esetén. Tehát a ρ > n eset statisztikai értelemben ritkán fordulhat elo.

n értékekre többen is igazolták. Véletlen mátrixokon végzett   statisztikai vizsgálatok   (n 1024) azt mutatják, hogy

 Megjegyezzük, hogy Wilkinson konstruált egy példát, amelyre részleges foelemkiválasztás esetén

ρ = 2n−1 , tehát ez a korlát pontos. Újabban találtak néhány, a gyakorlatban is

 megoldásánál) eloforduló  (differenciál- és integrálegyenletek közelíto esetet, amikor a rész leges foelemkiválasztáson alapuló Gauss-módszer

 ρ növekedési tényezoje exponenciálisan

 és a módszer csodöt  no mond.   nagyon A foelemkiválasztás nélküli Gauss-elimináció esetén a növekedési tényezo nagy lehet. Például az

  1.7846  −3.3848  A =   −0.2760 −0.2760  mátrix esetén a növekedési tényezo

−0.2760 0.7240 −0.2760 −0.2760

−0.2760 −0.3492 1.4311 −0.2760

−0.2760 −0.2760 −0.2760 0.7240

ρ = ρ4 (A) = 1.23 × 105 .

     

732

17. Tudományos számítások

A Gauss-módszer muveletigénye  A Gauss-módszer véges sok lépésben, véges sok aritmetikai alapmuvelet  ( +, −, zése után megadja az Ax

∗, / ) elvég= b (A ∈ Rn×n ) egyenletrendszer megoldását. A szükséges aritme-

 tikai muveletszám  (muveletigény)  az egyenletrendszer megoldó eljárások fontos minoségi  jellemzoje, mert az ilyen algoritmusok számítógépideje nagyjából arányos az aritmetikai muveletigénnyel.  Meggyelték, hogy a lineáris algebra számítási eljárásaiban az additív és a multiplikatív muveletek  száma nagyon gyakran közel azonos. Egy multiplikatív muve let ideje hagyományos számítógépeken lényegesen több mint egy additív muveleté,  de ez a nagyságrendi eltérés nem akkora, hogy az additív muveleteket  elhanyagolhatnánk. C. B. Moler a számítási igény mérésére bevezette az 1 (régi) op fogalmát. A nagyteljesítményu  szuperszámítógépeken nincs lényeges különbség az additív és a multiplikatív muveletekre   között, ezért újabban az új op fogalmát is használják. fordított ido

= s+ x∗y muvelet  (1 összeadás + 1 szorzás) elvégzéséhez kell, 1 (új) op pedig az a számítási munka, amely egy +, −, ∗, /

17.6. deníció. 1 (régi) op az a számítási munka, amely az s aritmetikai muvelet  elvégzéséhez kell.

Egy régi op 2 új oppal azonos. Mi a régi op értelmezést használjuk. A Gaussmódszer additív és multiplikatív muveletigényét  egyszeru  számolással megkapjuk, a teljes  muveletigényt  mondja ki a következo 3

17.7. tétel. A Gauss-módszer muveletigénye  n

/3 + Θ(n2 ) op.

Klyuyev és Kokovkin-Shcherbak igazolta, hogy ha csak sor- és oszlopmuveleteket  (sor, vagy oszlop számmal való szorzása; sorok, vagy oszlopok cseréje; sorok, vagy oszlopok számszorosának sorokhoz, vagy oszlopokhoz való hozzáadása) engedünk meg, akkor nem 3

lehet n

/3 + Ω(n2 ) opnál kevesebb muvelettel  az Ax = b lineáris egyenletrendszert megol-

dani. Az Ax

=

b alakú n

× n-es

egyenletrendszerek megoldásához szükséges muveletigény  2.808

gyors mátrixinvertáló eljárásokkal O(n

) opra leszorítható. A jelenleg ismert eljárásokat

numerikus instabilitásuk miatt gyakorlatilag nem használják. Az LU-felbontás Sok esetben könnyebb a problémát megoldani, ha valamely mátrixot két, bizonyos szem pontból elonyösebb tulajdonságú mátrix – pl. két háromszögmátrix – szorzatára tudunk bontani. 17.8. deníció. Az A

∈ Rn×n

= LU szorzatalakban tör∈ Rn×n pedig felso háromszögmátrix.

mátrix LU-felbontásán a mátrix A

téno  felbontását értjük, ahol L

∈ Rn×n

alsó, U

Az LU -felbontás nem egyértelmu.  Viszont, ha egy nemszinguláris mátrixnak létezik  foátlójában  LU -felbontása, akkor olyan is létezik, amelyben valamelyik tényezo csupa egyes áll. Az ilyen háromszögmátrixot egység háromszögmátrixnak nevezzük. Ez a felbontása a nemszinguláris mátrixoknak már egyértelmu  (persze, ha egyáltalán létezik). Nemszinguláris mátrixok LU -felbonthatóságára a Gauss-eliminációval való kapcsolat ad választ. Igazolható, hogy abban az A

=

LU szorzatban, amelyben L egység alsóhá-

 romszög mátrix, a foátló alatti lik elemekre lik

= γik , ahol γik

a Gauss-módszer algoritmus

  szerinti. Az U pedig az algoritmus eliminációs fázisa végeredményeként eloállított felso

733

17.2. Lineáris egyenletrendszerek

 a táblából, amennyiben az alsó háromszögrész háromszögmátrix. A L is kiolvasható ebbol  oszlopait végigosztjuk a foátlóbeli elemekkel. Emlékeztetünk arra, hogy a Gauss-módszer  algoritmus végrehajtása során a foátló alatti elemeket zikailag nem nulláztuk ki.) Világos, hogy nemszinguláris A esetén akkor és csak akkor létezik LU -felbontás, ha a pivotálás (k−1)

nélküli Gauss-elimináció során a

kk

, 0 minden pivotelemre teljesül.

17.9. deníció. A négyzetes P mátrixot permutációmátrixnak nevezzük, ha minden sorában és oszlopában pontosan egy darab 1-es van és a többi elem zérus.  Részleges foelemkiválasztás esetén a sorokat permutáljuk (más szóval: egy permutációmátrixszal szorzunk balról) és az akk

,

0 (k

= 1, . . . , n) minden nemszinguláris mátrixra

 teljesül. Igaz tehát a következo 17.10. tétel. Ha az n × n-es A mátrix nemszinguláris, akkor létezik olyan P permutációmátrix, hogy a PA mátrixnak van LU -felbontása. Az LU -felbontás algoritmusa tehát lényegében a Gauss-elimináció algoritmusa. Ter mészetesen, ha részleges foelemkiválasztással keressük a felbontást, akkor a sorcseréket a  foátló alatti (zikailag nem nullázott) elemeken is el kell végezni és a P mátrixot is meg kell jegyezni (pl. úgy, hogy egy vektorban tároljuk a mátrixsoroknak az eredetihez képesti mindenkori sorrendjét). Az LU- és Cholesky-módszerek Legyen A

=

LU és vizsgáljuk az Ax

b összefüggés miatt felbontható az Ly

= =

b megoldását. Ez az Ax

=

LU x

=

b alsó háromszögmátrixú és az U x

L(U x)

=

=

 y felso

háromszögmátrixú egyenletrendszerek megoldására. LU- (A, b) ´

3

= LU felbontást = b egyenletrendszert oldjuk meg az U x = y egyenletrendszert

4

return x

1

határozzuk meg az A

2

oldjuk meg az Ly

PA

ˆ =  Megjegyzés. Ha részleges foelemkiválasztást alkalmazunk, akkor értelemszeruen  az A ˆ = Pb vektort LU felbontást kapjuk (kimenetként a P-t is), majd jobb oldalként a b

=

vesszük. Az eredeti Gauss-módszer I. fázisában az A

=

LU felbontást és az U x

=

L

−1

 b felso

 A II. fázisban ezt az egyenletrendszert háromszögmátrixú egyenletrendszert állítjuk elo.  oldjuk meg. Az LU-módszerben a Gauss-módszer I. fázisát két lépésre bontjuk fel. Az elso lépésben az A

=

 és értelemszeruen LU felbontást állítjuk elo  nem végzünk számításokat a

b oszlopvektoron. Az eljárás második lépésében az y

=

L

−1

 Az eljárás b vektort állítjuk elo.

harmadik lépése megegyezik az eredeti Gauss-módszer II. fázisával.  Az LU-módszer különösen elonyös, ha ugyanazon együtthatómátrixszal egynél több Ax

= b1 ,

Ax

= b2 , . . . ,

Ax

= bk

alakú egyenletrendszert kell megoldani. Ekkor elég az A mátrix LU-felbontását egyszer

734

17. Tudományos számítások

= bi , U xi = yi (xi , yi, bi ∈ Rn , i = 1, . . . , k) háromszögmát3 2 rixú egyenletrendszereket megoldani. Az eljárás összköltsége: n /3 + kn + Θ (kn) op. n×n Ezen észrevétel alapján egy A ∈ R mátrix invertálását az LU-módszer segítségével meghatározni, majd rendre az Lyi

 a következoképpen végezhetjük: 1. Meghatározzuk az A

=

LU felbontást.

2. Sorra meghatározzuk az Lyi

=

ei , U xi

=

yi (ei az i-edik egységvektor, i

egyenletrendszerek xi megoldásait. Az A inverze A  3

Az eljárás muveletigénye  4n

/3 + Θ

2

n

−1

= 1, . . . , n)

= [x1 , . . . , xn ].

op.

Az LU-módszer pointeres technikával Lényegében a 60-as évek eleje óta ismert. A P vektor tartalmazza a sorok indexeit. Induláskor P [i]

=

i (1



i



 indexu n). Sorcserék esetén ténylegesen csak a P vektor megfelelo 

elemeit cseréljük ki. LU- -- (A, b) ´ ´

← sorok[A] ← [1, 2, . . . , n] for k ← 1 to n − 1

1

n

2

P

3 4

do határozzuk meg a t indexet, amelyre | A [P [t] , k]|

5 6

then cseréljük fel a P [k] és a P [t] komponensek értékét

7

for i

← k + 1 to n

do A [P [i] , k]

8

A [P [i] , k

9

← A [P [i] , k] /A [P [k] , k] + 1 : n] ← A [P [i] , k + 1 : n] − A [P [i] , k] ∗ A [P [k] , k + 1 : n]

19

← 1 to n ←0 for j ← 1 to i − 1     do s ← s + A P [i] , j ∗ x j x [i] ← b[P[i]] − s for i ← n downto 1 do s ← 0 for j ← i + 1 to n     s ← s + A P [i] , j ∗ x j x [i] ← (x [i] − s) /A [P [i] , i]

20

return x

10 11 12 13 14 15 16 17 18

= maxk≤i≤n |A [P [i] , k]|

j + p vagy i + q <

j

.

A sávot, amelynek elemei lehetnek nemnullák, azon ai j elemek deniálják, amelynek indexeire teljesül, hogy i − p ábrázolva

≤ j ≤ i + q, vagy ekvivalens módon j − q ≤ i ≤ j + p. Sematikusan

736

17. Tudományos számítások

           A =           

a11

a12

a21

a22

.. .

··· ..

···

..

0

···

···

. ..

.

0

0

.. . .. .

. ..

···

.

an−q,n

. ..

0

.

.

.

0

.. . .. .

. ..

.. ..

···

.

. ..

..

.. ..

.. . .. . .. .

···

0

. ..

a1+ p,1

a1,1+q

···

an,n− p

.

an,n−1

an−1,n ann

            .         

A sávmátrixok akkor érdekesek, ha p és q jóval kisebb mint n. Ismert, hogy ha létezik  sávszélességgel.A követkeLU-felbontás, akkor L és U is sávmátrix, az A-beli alsó és felso  zokben három részletben megadjuk az LU-módszer sávos változatát. S  -LU- ´ ´ ´ (A, n, p, q) 1 2

for k

←1

3 4 5 6

−1 ← k + 1 to min {k + p, n} do aik ← aik /akk for j ← k + 1 to min {k + q, n} do ai j ← ai j − aik ak j to n

do for i

return A Az ai j fogja tartalmazni li j -t, ha i

c ( p, q) op, ahol

( c ( p, q)

=

>

− n pq −

n pq

j és ui j -t, ha i

1 2 1 2

pq

2

qp

2

− −

1 6 1 6

3

p q

3



j. Az algoritmus muveletigénye 

+ pn, + qn,

 algoritmus felülírja a b vektort az Ly A következo

p p

≤q >q

= b egyenletrendszer megoldásával.

S -   ´ -(L, b, n, p) ´ ´ - ´ ¨ ´ 1 2 3

for i

←1

do bi

to n

← bi −

Pi−1

j=max{1,i− p}

li j b j

return b Az algoritmus muveletigénye  np

− p2 /2 op.

 algoritmus felülírja a b vektort az U x A következo

= b egyenletrendszer megoldásával.

S -   ´ -(U, b, n, q) ´  - ´ ¨ ´ 1 2 3

← n downto 1   Pmin{i+q,n} do bi ← bi − ui j b j /uii j=i+1

for i

return b

737

17.2. Lineáris egyenletrendszerek

Az algoritmus muveletigénye  n (q Legyen A

∈ R

n×n

+ 1) − q2 /2 op.

szimmetrikus, pozitív denit p alsó sávszélességgel. A Cholesky-

felbontás sávos változata: S  -C- ´ ´ ´ (A, n, p) 1

for i

2

←1

3

← max {1, i − p} to i − 1  P ← ai j − kj−=1max{1,i− p} aik a jk /a j j  1/2 P ← aii − ik−=1max{1,i− p} a2ik do ai j

4

aii

5

return A



to n

do for j

Az ai j elemek tartalmazzák az li j elemeket (i

3

p



 j). Az eljárás muveletigénye  np

   /3 + (3/2) n p − p2 op és n négyzetgyökvonás. n×n  sávszélességu Megjegyzés. Ha az A ∈ R p alsó és q felso 

2

 /2 −

sávmátrixon részleges

  háromszögmátrix sávszélessége foelemkiválasztást kell végrehajtani, akkor az U sávos felso  a sorcsere végrehajtásakor megnohet, legfeljebb a q ˆ

=

p

+ q értékre.

17.2.2. Lineáris egyenletrendszerek iteratív megoldási módszerei Lineáris egyenletrendszerek megoldására számos iteratív módszer ismert. Ezek közül legismertebbek a klasszikus Jacobi, a Gauss-Seidel és a különféle relaxációs módszerek. Az    könnyu iteratív módszerek legfobb elonye a nagyméretu  rendszerekre történo  alkalmazhatóságuk. Hátrányuk ugyanakkor az esetleges lassú konvergencia, amely háttérbe szorította ezeket a módszereket. Bizonyos típusú feladatok megoldásánál azonban, a könnyu  párhuza mosíthatóság miatt újra elotérbe kerültek az ún. multifelbontású ( multisplitting”) iteratív ” algoritmusok. Tekintsük az xi

= G xi−1 + b

(i

= 1, 2, . . .)

∈ Rn×n és x0 , b ∈ Rn . Ismert, hogy az { xi }∞ akkor és csak akkor koni=0 n vergál minden x0 , b ∈ R esetén, ha a G mátrix spektrálsugarára ρ (G) < 1 teljesül  −1 ∗ b, azaz (ρ (G) = max |λ| | λ a G sajátértéke ). Konvergencia esetén xi → x = (I − G) az (I − G) x = b egyenletrendszer megoldását kapjuk. A konvergencia gyorsasága a ρ (G) spektrálsugár nagyságától függ. Minél kisebb ρ (G), annál gyorsabb a konvergencia. iterációt, ahol G

Tekintsük most az Ax egyenletrendszert, ahol A

∈ Rn×n

=b

nemszinguláris mátrix. Az Ml , Nl , E l

∈ Rn×n

mátrixokat

az A multifelbontásának nevezzük, ha (i)

A

=

Mi

− Ni , i = 1, 2, . . . , L,

(ii) Mi nemszinguláris, i

= 1, 2, . . . , L,

(iii) E i nemnegatív diagonális mátrix, i (iv)

PL

i=1

Adott x0

Ei

=

= 1, 2, . . . , L,

I.

  ∈ Rn kezdovektorral a felbontáshoz tartozó iteratív módszer a következo.

738

17. Tudományos számítások

I (x0 , L, Ml , Nl , E l , l ´  ´ - ´

←0

1

i

2

while kilépési feltétel

=  ←i+1 for l ← 1 to L do Ml yl ← Nl xi−1 + b PL xi ← E l yl l=1

3

do i

4 5 5 7

= 1, . . . , L)

return xi Egyszeru  számolással kapjuk, hogy yl

xi

=

L X

E l yl

L X

=

−1

E l Ml

l=1

=

M

Nl xi−1

−1 l

Nl xi−1

+ Ml−1 b és

L X

+

−1

E l Ml

l=1

=

b

H xi − 1

+c .

l= 1

Tehát a konvergencia feltétele:

ρ (H) < 1. A multifelbontás algoritmus valódi párhuza-

mos algoritmus , mert iterációnként L lineáris egyenletrendszert lehet párhuzamosan megoldani (szinkronizált párhuzamosság). Az eljárás szuk  keresztmetszete xi iterált számítása. Az Mi mátrixok és az E i

súlymátrixok” megválasztása célszeruen  úgy történik, hogy ”

= c egyenletrendszer megoldása olcsó” legyen. Legyen S 1 , S 2 , . . . , S L az {1, . . . , n} ” L halmaz partíciója, azaz S i , ∅, S i ∩ S j = ∅ (i , j) és ∪i=1 S i = {1, . . . , n}. Legyenek továbbá az S i ⊆ T i ⊆ {1, . . . , n} halmazok (i = 1, . . . , L) olyanok, hogy legalább egy l indexre S l , Tl.

az Mi y

Az A mátrix nemátfedo  blokk Jacobi-multifelbontását az

Ml

Nl

El

 eloírás (l

=

=

=

h

(l)

Mi j

Ml

h

in i, j=1

(l)

,

Mi j

     =   

ai j ,

ha i, j

aii ,

ha i

0

=

∈ Sl , j , ,

egyébként,

−A,

(l)

Ei j

(

in i, j=1

e(l) = E ij

,

1,

ha i

0

= j ∈ Sl

egyébként

= 1, 2, . . . , L) deniálja.

Deniáljuk az A

=

M

−N

egyszeru  felbontást is, ahol M nemszinguláris,

M

=

h Mi j

in i, j=1

( ,

Mi j

=

ai j , 0

ha i, j

∈ Sl

valamely l

∈ {1, . . . , n} értékre

egyébként .

 blokk Jacobi-multifelbontásra fennáll, hogy Megmutatható, hogy a nemátfedo

H

=

L X

−1

E l Ml l= 1

Nl

=

M

−1

N

.

,

.

739

17.2. Lineáris egyenletrendszerek

Az A mátrix átfedo  blokk Jacobi-multifelbontását az

el M

el N

in (l)

h

e = M ij

i, j=1

i, j=1

= 1, 2, . . . , L) deniálja. ∈ Rn×n

Egy nemszinguláris A

−1

A

(l)

ai j ,

ha i, j

aii ,

ha i

0

=

∈ Tl , j , ,

egyébként .

el − A , =M

h (l) in e ei j el = e  eloírás (l

e M ij

,

     =   

(l)

,

E ii

= 0, ha i < T l

mátrixot M-mátrixnak nevezünk, ha ai j



0 (i

,

j) és

 elemei nemnegatívak. Igaz a következo

17.12. tétel. Tegyük fel, hogy A

n

átfedo, 

ei , N ei , Ei M

oL

i=1

∈ Rn×n

L

nemszinguláris M-mátrix, { Mi , Ni , E i }i=1 az A nem-

pedig az A átfedo  blokk Jacobi-multifelbontása, amelyekben az E i

súlymátrixok közösek. Ekkor igaz, hogy

  e ≤ ρ (H) < 1 , ρ H ahol H

=

PL

l=1

El M

−1 l

e Nl és H

=

PL

l=1

e El M

−1 e Nl .

l

 eljárás konvergenciája nem lassúbb mint Tehát mindkét eljárás konvergens és az átfedo  eljárásé. A tétel igaz marad akkor is, ha a blokk Jacobi-multifelbontások helyett a nemátfedo

ei blokk Gauss-Seidel típusú multifelbontásokat használunk. Ekkor a fent deniált Mi és M mátrixok helyett az alsó háromszög részüket kell venni. A multifelbontás algoritmusnak többlépéses és aszinkron változatai is ismertek.

17.2.3. Lineáris egyenletrendszerek hibaelemzése A vizsgálatban a direkt és az inverz hibákat elemezzük. Az Ax

= b egyenletrendszer megol-

 jelöléseket és fogalmakat használjuk. Az elméleti megoldásával kapcsolatban a következo

∆ x = xˆ − x. = r (y) = Ay − b mennyiséget reziduális hibának nevezzük. Az elméleti megoldás ese megoldás esetén pedig tén r (x) = 0, a közelíto  megoldásokat pedig x  megoldás direkt hibája dást x, a közelíto ˆ jelöli. A közelíto

Az r

r ( x) ˆ

=

Ax ˆ

−b=

A (x ˆ

− x) = A∆ x .

Az inverz hiba meghatározásához különféle modelleket használunk. A legáltalánosabb esetˆ egyenletrendszert, ahol ˆx ben feltesszük, hogy az x ˆ számított megoldás kielégíti az A ˆ = b ˆ A

=

A

+ ∆A és bˆ = b + ∆b. A ∆A és ∆b mennyiségeket inverz hibáknak nevezzük.

Meg kell különböztetnünk a probléma érzékenységét és a megoldó algoritmusok stabilitását. Egy adott probléma érzékenységén a megoldás változásának mértékét értjük a probléma (bemeneti) paramétereinek függvényében. Egy algoritmus érzékenységén vagy stabilitásán a számítási hibák végeredményre gyakorolt hatásának mértékét értjük. Egy problémát vagy algoritmust annál stabilabbnak tekintünk mennél kisebb a bemeneti paraméterek, ill. számítási hibák megoldásra (számított megoldásra) gyakorolt hatása. Az érzékenység,

740

17. Tudományos számítások

ill. stabilitás fogalmának egyik jellemzési formája a korábban látott kondíciószám, amely az eltérések relatív hibáit hasonlítja össze.  általános elveit lehet megfogalmazni: Algoritmusok felhasználásának a következo 1.

A gyakorlatban csak stabil (jól kondicionált) algoritmusokat használunk.

2.

Instabil (inkorrekt kituzés  u  vagy rosszul kondicionált) feladatot általános célú algoritmusokkal általában nem tudunk megoldani.

Érzékenységvizsgálat Tegyük fel, hogy az Ax

= b egyenlet helyett a perturbált = b + ∆b

Ax ˆ egyenletrendszert oldjuk meg. Legyen x ˆ 17.13. tétel. Ha A nemszinguláris és b

(17.17)

= x + ∆ x és vizsgáljuk a két megoldás eltérését.

, 0, akkor

ˆ k k∆bk kr ( x) k∆ xk ≤ cond(A) = cond(A) , k xk kbk kbk



−1 ahol cond(A) = k Ak A az A mátrix ún. kondíciószáma.

(17.18)

 látható, hogy az A mátrix kondíciószáma erosen  A tételbol befolyásolhatja az x ˆ perturbált megoldás relatív hibáját. Egy rendszert jól kondicionáltnak nevezünk, ha cond(A) kicsi, és rosszul kondicionáltnak nevezünk, ha cond(A) nagy. Értelemszeruen  a nagy és ki relatívak és környezetfüggok.  csi jelzok A kondíciószám függ a normától. Ha a normától  való függés például cond∞ (A)

lényeges, akkor ezt külön jelöljük. Ennek megfeleloen

kAk∞

A−1

∞ .

=

 A kondicionáltság egy lehetséges geometriai jellemzését adja a következo

példa. 17.7. példa. Az 1000x1 999x1

+ +

egyenletrendszer rosszul kondicionált (cond∞ (A)

999x2 998x2

= =

b1 b2

= 3.99 × 10

6

). A két egyenes majdnem párhuzamos.

 ot  ol.  Ezért, ha perturbáljuk a jobb oldalt, az új metszéspont messze lesz az eloz

A most vizsgált modellben az inverz hiba

∆b, a 17.13. tétel pedig a relatív direkt hibára

 látszik: az ad becslést. Ez teljes összhangban van a hibaszámítási ökölszabállyal. A tételbol ˆ k / kbk relatív reziduális hiba kicsi voltából csak akkor következik, hogy az x ˆ perturbált kr ( x) megoldás relatív hibája is kicsi, ha A kondíciószáma kicsi.

= b egyenletrendszert, ahol " # " # 1+ 1 1 A = , b= ,

17.8. példa. Tekintsük az Ax

1

" Legyen x ˆ

=

2

−1

# . Ekkor r

" =

2 0

1

1

" x

=

0 1

# .

# és kr k∞

/ kbk∞ = 2 , de k xˆ − xk∞ / k xk∞ = 2.

741

17.2. Lineáris egyenletrendszerek

Tegyük most fel, hogy az Ax

= b egyenletrendszer helyett a perturbált (A

+ ∆A) xˆ = b

(17.19)

egyenletrendszert oldjuk meg. Igazolható, hogy ennél a modellnél több inverz hiba is létezik, ezek közül x ˆ , r ( x) ˆ

,

0 esetén a minimális spektrálnormájú inverz hiba:

∆A =

T T −r ( x) ˆ x ˆ /x ˆ x. ˆ

 tétel azt mondja ki, hogy kis relatív reziduális hiba esetén a relatív inverz A következo hiba is kicsi.

, 0 az Ax = b egyenletrendszer közelíto megoldása, T T , 0. Ha kr ( x) ˆ k2 / kbk2 = α < 1, akkor a ∆ A = −r ( x) ˆ x ˆ /x ˆ x ˆ mátrixra fennáll, hogy (A + ∆ A) x ˆ = b és k∆ Ak2 / k Ak2 ≤ α/ (1 − α). 17.14. tétel. Tegyük fel, hogy x ˆ det (A)

,

0 és b

Ha a relatív inverz hiba kicsi és A kondíciószáma kicsi, akkor a relatív reziduális hiba  tétel. is kicsi. Erre mutat rá a következo 17.15. tétel. Ha r ( x) ˆ =A x ˆ − b, (A

+ ∆A) xˆ=b, A , 0, b , 0 és cond (A) k∆Ak / kAk < 1, akkor k∆Ak k Ak k∆Ak cond(A) k Ak

cond(A)

ˆ k kr ( x) ≤ kbk

1



.

(17.20)

Ha A rosszul kondicionált, akkor a 17.15. tétel állítása nem teljesül.

"

+

#

1

"

0

0

#

"

1

#

, ∆A = és b = , (0 <   − 0 2 −1 2 2 cond∞ (A) = (2 +  ) / ≈ 4/ és k∆ Ak∞ / k Ak∞ =  / (2 +  ) ≈  /2. Legyen most " # " # 2 3 1 2− + 2/ −1 x ˆ = (A + ∆ A) b = ≈ . −2 −  −2/ 3 3 " # 0 Ekkor r ( x) ˆ = Ax ˆ−b = . Ezért kr ( x) ˆ k∞ / kbk∞ = 2/ + 1, ami nem kicsi. 2/ + 1

17.9. példa. Legyen A 2

=

1

2

1

1

1). Ekkor

2

A legáltalánosabb esetben az Ax

= b egyenlet helyett a perturbált

(A

+ ∆A) xˆ = b + ∆b

(17.21)

 egyenletrendszert oldjuk meg. Igaz a következo

k∆Ak k Ak

< 1 és b , 0, akkor  k∆Ak k∆bk  k∆ xk cond(A) kAk + kbk ≤ . k∆Ak k xk 1 − cond(A) k Ak

17.16. tétel. Ha A nemszinguláris, cond (A)

(17.22)

 következik a következo  Fenti tételbol Ökölszabály. Tegyük fel, hogy Ax cond(A)

∼ 10t , ahol t <

=

ökölszabály”. ” b. Ha A és b elemei s decimális jegyre pontosak és

s. Ekkor a számított megoldás kb. s

A 17.16. tétel cond(A) k∆ Ak / k Ak hogy az A

+ ∆A

<

− t jegyre lesz pontos.

1 feltételének jelentése szemléletes: azt biztosítja,

mátrix ne legyen szinguláris. A cond(A) k∆ Ak / k Ak

<

 1 egyenlotlenség

742

17. Tudományos számítások

ugyanis ekvivalens a

k∆Ak <

1

k A− k 1

feltétellel és az A nemszinguláris mátrix legközelebbi



szinguláris mátrixtól való távolsága éppen 1/ A jellemzését adhatjuk: 1 cond (A)

=

−1

. Ez alapján a kondíciószám egy újabb

k∆Ak . A+∆ A szinguláris k Ak min

(17.23)

Eszerint, ha egy mátrix rosszul kondicionált, akkor közel van egy szinguláris mátrixhoz. Megjegyezzük, hogy mátrixok kondíciószámát az F (x)

=

A

−1

x leképezés kondíciószámá-

 becsléseként már korábban is megkaptuk. nak felso  deníciót. Vezessük be a következo 17.17. deníció. Egy lineáris egyenletrendszer megoldó eljárást gyengén stabilnak neve-

∈ H mátrix és minden b esetén = b egyenletrendszer xˆ számított megoldásának k xˆ − xk / k xk relatív hibája kicsi.

zünk egy H mátrixosztályon, ha minden jól kondicionált A az Ax

 eredményt kapjuk. Ha a 17.13–17.16. tételeket összerakjuk, akkor a következo 17.18. tétel (Bunch). Egy lineáris egyenletrendszer megoldó algoritmus gyengén stabil a H mátrixosztályon, ha minden jól kondicionált A



H mátrix és minden b esetén az Ax

=b

egyenletrendszer x ˆ számított megoldására fennáll az alábbi feltételek bármelyike: (1)

k xˆ − xk / k xk kicsi;

(2) kr ( x) ˆ k / kbk kicsi; (3) Létezik

∆A úgy, hogy (A + ∆A) xˆ = b és k∆Ak / kAk kicsi.

A 17.16. tétel becslését a gyakorlatban akkor tudjuk jól használni, ha ismert

∆b, ∆A és

 megoldás hibáját csak utólagocond(A) vagy ezek egy becslése. Ezek hiányában a közelíto san (a posteriori) lehet becsülni.   A következokben komponensenkénti hibabecslésekkel foglalkozunk. Elsoként a köze megoldás abszolút hibájára adunk becslést az inverz hibák komponenseinek segítségélíto vel. 17.19. tétel (Bauer-Skeel). Legyen A

∈ Rn×n

Rn ×n , s ∈ Rn és ε >

− ε A 1 S

∞ < 1, akkor

S ∈

=b + E) xˆ = b + e egyenletrendszert. Ha s ≥ 0, | E | ≤ εS , |e| ≤ ε s, valamint

nemszinguláris és tegyük fel, hogy az Ax

egyenletrendszer x ˆ közelíto  megoldása kielégíti az (A 0 olyanok, hogy S



0,



ε

A−1 (S | x| + s)





. k xˆ − xk∞ ≤ 1 − ε A−1 S

(17.24)



Ha e

= 0 (s = 0), S = |A| és kr (A)

=

A−1 |A|

∞ < 1,

akkor a

k xˆ − xk∞ ≤

1

εkr (A) − εkr (A)

(17.25)

(17.26)

becslést kapjuk. A kr (A) mennyiséget Skeel-féle normának nevezzük, noha a szokásos értelemben nem norma. A Skeel-féle norma kielégíti a kr (A)

≤ cond∞ (A) = kAk∞

A−1



(17.27)

743

17.2. Lineáris egyenletrendszerek

 egyenlotlenséget. Tehát a fenti becslés nem rosszabb, mint a hagyományos kondíciószámot  használó becslés. Az inverz hiba komponensenkénti becslését teszi lehetové Oettli és Práger  eredménye. következo Legyenek adottak az A, δ A

∈ Rn×n

mátrixok és a b, δb

δA ≥ 0 és δb ≥ 0. Legyen továbbá  n×n D = ∆A ∈ R : |∆ A| ≤ δ A , 17.20. tétel (Oettli-Práger). (A

G

∈ Rn

vektorok. Tegyük fel, hogy

= {∆b ∈ Rn : |∆b| ≤ δb} .

Egy x ˆ számított megoldás akkor és csak akkor megoldása egy

+ ∆A) xˆ = b + ∆b perturbált egyenletrendszernek, ahol ∆A ∈

D és

∆b ∈ G, ha

ˆ | = |A x ˆ − b| ≤ δ A | x ˆ | + δb. |r ( x)

(17.28)

A tétel alkalmazásához nem kell a kondíciószám ismerete. A gyakorlatban

δA

és

δb

elemei a gépi epszilonnal arányosak. 17.21. tétel (Wilkinson). Az Ax

= b egyenletrendszer Gauss-módszerrel lebegopontos  arit-

metikában kapott x ˆ közelíto  megoldása kielégíti az (A

+ ∆A) xˆ = b

(17.29)

egyenletrendszert, ahol

k∆Ak∞ ≤ 8n3 ρn kAk∞ u + O(u2 ),

(17.30)

ρn a pivot elemek növekedési tényezoje  és u az egységnyi kerekítés mértéke. Minthogy a gyakorlatban

ρn kicsi, a k∆Ak∞ ≤ 8n3 ρn u + O(u2 ) kAk∞

relatív inverz hiba is az. Ezért a 17.18. tétel alapján a Gauss-elimináció gyengén stabil mind  a teljes, mind pedig a parciális foelemválasztás esetén.  kapjuk, hogy A Wilkinson tételbol cond∞ (A)

  k∆Ak∞ ≤ 8n3 ρn cond∞ (A) u + O u2 . kAk∞

Kis kondíciószám esetén feltehetjük, hogy 1−cond∞ (A) k∆ Ak∞ 17.16. tételek felhasználásával (∆b kapjuk:

=

/ kAk∞ ≈

1. A 17.21. és a

 becslést 0 eset) a direkt hibára az alábbi közelíto

k∆ xk∞ ≤ 8n3 ρn cond∞ (A) u . k xk∞

(17.31)

Ez az ökölszabály helyességét támasztja alá a Gauss-módszer esetén.  példát, amelynek együtthatóit pontosan tudjuk ábrázolni: 17.10. példa. Tekintsük a következo 888445x1 887112x1

+ 887112x2 = 1, + 885781x2 = 0 .

Itt cond(A)∞ ugyan nagy, de cond∞ (A)k∆ Ak∞ /k Ak∞ elhanyagolható az 1 mellett. A feladat pontos megoldása x1

=

885781, x2

= −887112. A MATLAB által adott közelíto megoldás

x ˆ1

=

885827.23,

744 x ˆ2

17. Tudományos számítások

= −887158.30, amelynek relatív hibája k x − xˆk∞ = 5.22 × 10−5 . k x k∞

Minthogy s

≈ 16 és cond (A)∞ ≈ 3.15 × 1012 , az eredmény lényegében megfelel a Wilkinson tételnek,

ill. az ökölszabálynak. A Wilkinson tétel az inverz hiba mértékére a

k∆Ak∞ ≤ 1.26 × 10−8 δA =  M |A| és δb =  M |b| választással alkalmazva kapjuk, hogy −10 ˆ | + δb. Minthogy |δ Ak∞ = 3.94 × 10 , ez jobb becslést ad a k∆ Ak∞ inverz hibára, mint ˆ | ≤ δA | x |r ( x)

becslést adja. Az Oettli-Práger tételt a a Wilkinson-féle eredmény.

Skálázás és prekondicionálás  Számos, gyakorlati alkalmazásban eloforduló mátrix rosszul kondicionált, ha n rendszáma nagy. Ilyen például a

" Hn

Hilbert-mátrix, amelyre cond2 (Hn )

=

1 i

+ j−1

#n (17.32) i, j=1

≈ e3.5n , ha n → ∞. Léteznek olyan egész elemu 2n × 2n

 mátrixok is, amelyek a szabványos IEEE754 lebegopontos aritmetikában pontosan ábrázol hatók és amelyek kondíciószáma közelítoleg 4

× 1032n .

 módja ismeretes: többA nagy kondíciószámú egyenletrendszerek megoldásának két fo szörös pontosságú aritmetika használata vagy a kondíciószám csökkentése. A kondíciószám csökkentésének két formája is ismert. 1. Skálázás. Az Ax

= b egyenletrendszert helyettesítjük az (RAC) y

= (Rb)

(17.33)

egyenletrendszerrel, ahol R és C diagonális mátrixok. Erre a skálázott egyenletrendszerre alkalmazzuk a Gauss-eliminációt. Ennek y megoldásával kapjuk vissza az x

= Cy megoldást. Ha az RAC mátrix kondíciószáma kisebb, akkor

 y hibája is vélhetoen kisebb lesz, így összességében az x pontosabb közelítését is megkaphatjuk. Számos stratégia ismeretes az R és C skálázó mátrixok megválasztására. Az egyik legismertebb stratégia az ún. kiegyensúlyozás, amelynek eredményeként az RAC mátrix valamennyi sora és oszlopa valamilyen normában mérve közel ugyanakkora lesz. Például a

ˆ D

    1 1  = diag 

T

, . . . ,



 T

a1 2

an 2

T ˆ skálázott mátrix sorainak választás esetén, ahol ai az A mátrix i-edik sorvektorát jelöli, a DA

euklideszi normája azonosan 1 lesz. Erre a skálázásra fennáll, hogy



ˆ cond2 DA

ahol D+

=



diag (d1 , . . . , dn )

skálázza az A mátrix sorait.







n min cond2 (DA) D∈ D+



| d1 , . . . , dn > 0

,

ˆ közelítoleg  . Ez azt jelenti, hogy D optimálisan

745

17.2. Lineáris egyenletrendszerek

 Tekintettel arra, hogy a skálázás és a foelemkiválasztás együttes hatása esetenként igen  példa egy rossz eredményekre vezet, az eljárást újabban ritkán használják. A következo ilyen esetet mutat be. 17.11. példa. Tekintsük az

  /2  A =   1 1

mátrixot az 0

1

1

1

1

1

2

   

<   1 esetben. Igazolható, hogy cond∞ (A) = 12. Legyen √   0   2/  0√   .  / 2 0 R =C =  0   √ 0 0 /2

Ekkor a skálázott mátrix

   RAR =  

amelynek kondíciószáma cond∞ (RAR)

=

2

1

1

1

/4 /4

/4 /2

1

32/ . Ez kis



    ,

esetén nagyon nagy érték. Tehát a skálázás

elrontja a példabeli mátrixot.

2. Prekondicionálás. A prekondicionálás tulajdonképpen a skálázással rokon. A szimmetrikus és pozitív denit mátrixú Ax ˜ Ax

 alakba, ahol M olyan, hogy cond M

= b egyenletrendszert átírjuk az ekvivalens

= (MA) x = 

−1

Mb

= b˜

(17.34)

 legkisebb és könnyu A a leheto  megoldani az Mz

=y

alakú egyenletrendszereket. A prekondicionálást általában iteratív módszerekkel együtt használjuk, módszerenként specializált formában. Utólagos hibabecslések  megoldás hibájának utólagos becslése azért szükA valamilyen módszerrel kapott közelíto séges, hogy valamilyen támpontunk legyen az eredmény megbízhatóságáról. Az irodalom  ban számos módszer ismeretes. Ezek közül ismertetünk három szert. Az

Θ

  n

2

Θ

2

n

op költségu  mód-

egyszeri költségu  becslések ésszeru  számítási többletet jelentenek az

költségu  direkt módszerekhez képest és elfogadhatók az iteratív módszerek

Θ

  n

2

Θ

  3

n

iterációs

lépésenkénti számítási költségével szemben is.

A direkt hiba becslése a reziduális segítségével

17.22. tétel (Auchmuty). Jelölje x ˆ az Ax

=

b egyenletrendszer valamilyen módon kiszámí-

tott közelíto  megoldását. Ekkor igaz, hogy 2 c kr( x) ˆ k2

, k x − xˆk2 =

AT r( x) ˆ 2

ahol a hibakonstansnak nevezett c-re c

≥ 1 teljesül.

746

17. Tudományos számítások

Megemlítjük, hogy a c hibakonstans az A-tól függ, de értékét nem befolyásolja az x ˆ−x hibavektor nagysága, csak az iránya. Igaz továbbá, hogy C 2 (A)

=

1 2

cond2 (A)

+

1

!

cond2 (A)

≤ cond2 (A) .

 C 2 (A) értéket csak kivételes, de egzakt módon megadható A c hibakonstans a felso esetekben éri el. A számítógépes tapasztalatok azt mutatják, hogy c az A mátrix rendjével (n)  és jobban függ n-tol,  mint A kondíciószámától. A számítógépes tesztelések együtt lassan no statisztikai feldolgozása alapján a

T

2 ˆ k2 / A r ( x) ˆ k x − xˆk2 / 0.5 dim (A) kr ( x) 2

(17.35)

becslés nagy tapasztalati valószínuséggel  teljesül.

Az



A−1 LINPACK becslése



−1



A becslésére. OldT − 1 juk meg rendre az A y = d, Aw = y egyenletrendszereket. Az A becslése:  eljárást A LINPACK programcsomagban használják a következo

−1

kwk

A ≈ kyk





 ≤ A−1 .

(17.36)

 

A−1 A−T d

kwk

= , kyk

A−T d

Minthogy

 hatványmódszer az eljárás felfogható a sajátértékszámítási fejezetben ismertetésre kerülo alkalmazásának. A becslés az 1, 2 és solt komponensei

∞ normák esetén alkalmazható. A d vektor java ±1 értékuek.  Az elojeleket lehet véletlenszeruen  választani. A LINPACK

 rendszerben az elojelek megválasztása egy adaptív stratégiával történik. Ha az Ax

=

b egyenletrendszert az LU-módszerrel oldottuk meg, akkor a további

egyenletrendszerek megoldása

Θ(n ) op rendszerenként, így a LINPACK becslo eljárás 2

−1  megoldás hibája költsége kicsi marad. Az A becslés segítségével cond(A) és a közelíto

 (vö. a 17.16. tétellel, vagy az ökölszabállyal). Megjegyezzük, hogy már könnyen becsülheto más hasonló eljárások is ismertek.

Az inverz hiba Oettli-Práger-féle becslése  formában szokás Az inverz hiba becsléséhez az Oettli-Práger eredményt a következo

= A xˆ − ≥ 0. Legyen

használni. Legyen r ( x) ˆ hogy E

≥ 0 és

f

b a reziduális hiba, E

∈ Rn×n

és f

∈ Rn

adottak úgy,

ˆ i| |r ( x) , + f )i ahol 0/0-át 0-nak, ρ/0-át pedig ∞-nek deniáljuk, ha ρ , 0. Az (y)i jelölés az y vektor iedik komponensét jelöli. Ha ω , ∞, akkor van egy ∆ A mátrix és egy ∆b vektor, amelyekkel

ω = max i

(E | x ˆ|

fennáll

|∆A| ≤ ωE ,

|∆b| ≤ ω f

és (A

+ ∆A) xˆ = b + ∆b.

747

17.2. Lineáris egyenletrendszerek

Továbbá

ω

a legkisebb olyan szám, amelyre a fenti tulajdonságú

∆A

és

∆b

létezik. Az

ω

mennyiség az E és f mennyiségekben kifejezett relatív inverz hibát méri. Ha egy adott E, f és x ˆ esetén

ω

kicsi, akkor a perturbált probléma is (és ennek megoldása is) közel van

az eredetihez (és ennek megoldásához). A gyakorlatban az E

= |A|,

f

= |b|

választást

preferálják.  megoldás iteratív javítása A közelíto

=

Jelölje x ˆ az Ax

 megoldását. Legyen r(y) b egyenletrendszer közelíto

=

Ay



b az y

 megoldás pontosságát a következo  iteratív eljárással pontbeli reziduális hiba. Az x ˆ közelíto lehet javítani. I´-´ ˆ , tol) ´ (A, x

←1 ← xˆ dˆ ← ∞



while = dˆ / k xk k > tol do r ← Axk − b

1

k

2

x1

3 4 5 6

számítsuk ki az Ad

← xk − ←k+1

7

xk+1

8

k

9

= r egyenletrendszer dˆ közelíto megoldását LU-módszerrel



return xk Az eljárásnak különféle változatai ismertek. Az LU-módszer helyett más módszer is

használható. Legyen

η az a legkisebb relatív inverz hibakorlát, amelyre (A

+ ∆A) xˆ = b + ∆b,

|∆A| ≤ η |A| ,

|∆b| ≤ η |b| .

Legyen továbbá

σ (A, x) = max (|A| | x|)k / min (|A| | x|)k ,

min (| A| | x|)k

k

k

k

>0.

 Igaz a következo



−1

17.23. tétel (Skeel). Ha kr A



σ (A, x) ≤

c1

< 1/ M ,

akkor elég nagy k esetén fennáll,

hogy (A

+ ∆A) xk = b + ∆b,

|∆A| ≤ 4η M |A| ,

 iteráció után, a k Ez az eredmény gyakran az elso

=

|∆b| ≤ 4η M |b| .

(17.37)

2 értékre teljesül. Jankowski és

φ módszerre = b egyenletrendszer 1-nél kisebb relatív hibájú xˆ közelítését állítja  azaz amelyre k x elo, ˆ − xk ≤ q k xk (q < 1). Igazolták, hogy az iteratív javítás még egyszeres   megoldás pontosságát és a φ pontosságú lebegopontos aritmetikában is javítja a közelíto  Wozniakowski az iteratív javítást a Gauss-elimináció helyett tetszoleges olyan vizsgálták, amely az Ax

módszert gyengén stabillá teszi.

Gyakorlatok 17.2-1. Bizonyítsuk be a 17.7. tételt.

748

17. Tudományos számítások

= b és az (ii) Bx = b egyenletrendszert, ahol " # " # 1 1/2 1 −1/2 A = , B= , 1/2 1/3 1/2 1/3

17.2-2. Tekintsük az (i) Ax

b pedig kétkomponensu  vektor. A két egyenlet közül melyik érzékenyebb a b perturbációjára? Az érzékenyebb egyenletnél a b -t hányszor kisebb relatív hibával kell ismernünk, hogy ugyanolyan pontossággal határozhassuk meg a megoldást, mint a másiknál? 17.2-3.

−1

χ = 3/229 és ζ = 214 . Oldjuk meg , 10−5 , 10−7 , 10−10 -re, ahol     χζ  −ζ ζ   −1   −1 ζ ζ 0 , b = A =     −1 −1 −1  ζ −χζ ζ

Legyen

ε = 10 , 10

−3

az Ax

=

b egyenletrendszert

   1+ε   . 1 1

Mit tapasztalunk? Adjunk magyarázatot.  17.2-4. Legyen A 10×10-es mátrix és válasszuk prekondicionáló mátrixnak az A foátlójából és két mellékátlójából álló sávmátrixot. Mennyit javul a rendszer kondíciószáma, ha (i) A véletlen mátrix; (ii) A Hilbert-mátrix? 17.2-5. Legyen

   A =  

1/2

1/3

1/3

1/4

1/4

1/5

   1/5   , 1/6 1/4

∈ R3 komponenseinek közös hibakorlátja pedig ε. Adjuk meg az Ax = b egyenletrendT szer [x1 , x2 , x3 ] megoldásának, valamint az (x1 + x2 + x3 ) összeg (minél élesebb) hibakora b

látját. 17.2-6. Tekintsük az Ax

=

 megoldása legyen b egyenletrendszert, amelynek egy közelíto

x ˆ. (i) Vezessünk le az x ˆ -ra hibakorlátot, ha az (A sem A

+ E) xˆ =

b pontosan teljesül és sem A,

+ E nemszinguláris.

(ii) Adjunk (ha lehetséges) A elemeire relatív hibakorlátot, melyen belül maradva nem változik a megoldás egyik komponensének sem az egész része, ha

   A =  

10

7

8

7

5

6

8

6

10

    ,

   b =  

25 18 24

    .

17.3. Sajátértékszámítás A mátrixok sajátérték-feladatának megfogalmazásához szükségünk van a komplex elemu  mátrixok és vektorok bevezetésére. A komplex elemu  n dimenziós oszlopvektorok halmazát

× n típusú komplex elemu mátrixok halmazát Cm×n n m×n jelöli. Nyilvánvalóan fennáll, hogy R ⊂ C és R ⊂ Cm×n . A valós elemu vektorokra és n

C -nel jelöljük. Hasonlóképpen az m

n

mátrixokra bevezetett muveletek  és a determináns értelemszeruen  ugyanazok maradnak a komplex esetben is.

749

17.3. Sajátértékszámítás

∈ Cn×n tetszoleges  mátrix. A λ ∈ C számot az A mátrix sajátérté(x , 0) vektort pedig a λ sajátértékhez tartozó (jobb oldali) sajátvektornak

17.24. deníció. Legyen A kének, az x

∈C

n

nevezzük, ha Ax

= λx .

A sajátvektor egy olyan vektor, amelyet az x



(17.38) Ax leképezés a saját hatásvonalán hagy

(irányítás, nagyság változhat). A sajátérték-feladat megoldása a sajátértékek és a hozzájuk tartozó sajátvektorok meghatározását jelenti. Az Ax

= λ x egyenletrendszer átrendezéssel az ekvivalens (A − λI)x = 0 alakra hozható

 méretu (I a megfelelo  egységmátrix). Ennek a homogén egyenletrendszernek akkor és csak  megoldása, ha akkor van nullától különbözo

   φ(λ) = det(A − λI) = det   

a11

−λ

a21

.. .

an1

... a22 − λ . . . .. .. . . an2 ... a12

    = 0 .  

a1n a2n

.. . ann − λ

(17.39)

A (17.39) egyenletet az A mátrix karakterisztikus egyenletének nevezzük, melynek gyökei a mátrix sajátértékei. A determinánst kifejtve a

λ változó n-ed fokú polinomját, azaz a

φ(λ) = (−1)n (λn − p1 λn−1 − · · · − pn−1 λ − pn ) karakterisztikus polinomot kapjuk. Az algebra alaptétele miatt az A

∈ Rn mátrixnak, a mul-

tiplicitásokat is beleszámítva, pontosan n sajátértéke van, melyek között lehetnek valósak és komplex konjugált párok. Valós mátrixok komplex sajátértékeit és sajátvektorait valós aritmetika használata esetén csak speciális technikákkal kaphatjuk meg. Ha t

,

0, akkor egy x sajátvektor t-szerese is sajátvektor. Egy

lineárisan független sajátvektorok száma legfeljebb annyi, mint

λk

λk

sajátértékhez tartozó

multiplicitása a (17.39)

 sajátértékekhez tartozó sajátvektorok lineárisan függetlenek. egyenletben. A különbözo  két tétel. A sajátértékek nagyságát és geometriai elhelyezkedését jellemzi a következo 17.25. tétel. Legyen mában fennáll, hogy

λ az A mátrix |λ| ≤ kAk.

17.26. tétel (Gersgorin). Legyen A

ri

=

tetszoleges  sajátértéke. Tetszoleges  indukált mátrixnor-

∈ Cn×n , n X ai j

(i

= 1, . . . , n)

j=1, j,i

és Di Ekkor az A mátrix minden

= {z ∈ C| |z − aii | ≤ ri }

(i

= 1, . . . , n) .

λ sajátértékére fennáll, hogy λ ∈ ∪ni=1 Di .

 Például, ha A háromszögmátBizonyos mátrixok esetén a (17.39) megoldása egyszeru.  rix, akkor kiolvasható, hogy a sajátértékek a foátlóbeli elemek. A legtöbb esetben azonban az összes sajátérték és sajátvektor meghatározása elvileg is komoly gondokat okoz. Ezért is  van gyakorlati jelentosége az olyan transzformációknak, melyek a sajátértékeket változatla nul hagyják. Mint késobb látni fogjuk, az ilyen transzformációk sorozatával nyert új mátrix  sajátértékfeladata egyszerubben  kezelheto.

750

17. Tudományos számítások

× n méretu A és B mátrix hasonló, ha van egy T mátrix úgy, = T −1 AT . Az A → T −1 AT leképezést hasonlósági transzformációnak nevezzük.

17.27. deníció. Az n B

17.28. tétel. Tegyük fel, hogy az n B

=

T

−1

× n méretu T

mátrixra det(T )

hogy

, 0 teljesül. Ekkor az A és = T −1 x a B

AT mátrix sajátértékei megegyeznek. Ha x az A sajátvektora, akkor y

sajátvektora. A tétel tartalma az, hogy hasonló mátrixok sajátértékei megegyeznek. A sajátérték feladat nehézségét tovább fokozza az a tény, hogy a sajátértékek és sajátvektorok a mátrixelemek megváltozására – ezért a számítás közbeni kerekítési hibákra is –  nagyon érzékenyek. Az eredeti A mátrix és a perturbált A + δ A mátrix sajátértékei jelentosen eltérhetnek egymástól és a sajátértékek multiplicitása is megváltozhat. A sajátérték-feladat  tételekkel és példákkal jellemezhetjük. érzékenységét a következo 17.29. tétel (Ostrowski-Elsner). perturbált A

Az A

+ δA mátrix egy olyan µk



n×n

C

mátrix minden

λi

sajátértékéhez létezik a

sajátértéke, hogy 1

|λi − µk | ≤ (2n − 1) (kAk2 + kA + δAk2 )1− kδAk2 . 1

n

n

A tétel azt mutatja, hogy a sajátértékek folytonosan változnak és azt, hogy a megváltozás mértéke arányos a

δA perturbáció mértékének n-edik gyökével.

17.12. példa. Vizsgáljuk meg egy cióját:

µ sajátértékhez tartozó r × r méretu Jordan-mátrix alábbi perturbá          

µ

1

0

µ .. .

.. .

1

..

.

..

0



0

0

. ...

... .. . .. . µ 0

  ..  .    .  0    1   µ 0

A perturbált mátrixhoz tartozó karakterisztikus egyenlet (λ mátrix r-szeres

− µ)r =  ,

ahonnan az eredeti Jordan-

µ sajátértéke helyett az r különbözo λ s = µ +  1/r (cos (2sπ/r) + i sin (2sπ/r))

(s

= 0, . . . , r − 1)

1/r sajátértéket kapjuk. A sajátértékek megváltozásának mértéke  , amely megfelel a 17.29. tétel állítá|µ| ≈ 1, r = 16 és  =  M ≈ 2.2204 × 10−16 értékeket vesszük, akkor a sajátértékek

sának. Ha például eltérése

 mértéku ≈ 0.1051. Ez pedig a mátrix perturbációjához képest a sajátértékek egy igen jelentos 

megváltozását jelenti.

Speciális tulajdonságú mátrixok és perturbációk esetén a sajátértékek megváltozása az Ostrowski-Elsner tételben látottnál jóval kisebb is lehet.

∈ Cn×n diagonalizálható mátrix, azaz létezzen olyan X = diag(λ1 , . . . , λn ). Jelölje µ az A + δA mátrix sajátértékét. Ekkor

17.30. tétel (Bauer-Fike). Legyen A mátrix, hogy X

−1

AX

min

1≤i≤n

|λi − µ| ≤ cond2 (X) kδAk2 .

(17.40)

751

17.3. Sajátértékszámítás

Tehát diagonalizálható mátrix perturbációja esetén a sajátértékek megváltozásának mértéke arányos az általában ismeretlen X mátrix kondíciószámával és

kδAk2 -val.

Ez aszimp-

totikusan lényegesen jobb eredmény, mint az Ostrowski-Elsner tétel, azonban ne felejtsük, hogy cond2 (X) igen nagy is lehet. Az A mátrix sajátértékei folytonos függvényei a mátrix elemeinek. Ez a normált saját példa is mutatja, hogy az vektorokra is igaz, ha a sajátértékek egyszeresek. A következo utóbbi állítás többszörös sajátértékek esetén már nem igaz. 17.13. példa. Legyen

" A (t)

=

1

+ t cos (2/t) −t sin (2/t)

−t sin (2/t) 1 − t cos (2/t)

# (t

, 0) .

λ1 = 1 + t és λ2 = 1 − t. A λ1 sajátértékhez tartozó λ2 -höz tartozó pedig [cos (1/t) , − sin (1/t)]T . Ha t → 0, akkor " # 1 0 A (t) → I = , λ1 , λ2 → 1 ,

Az A (t) mátrix sajátértékei [sin (1/t) , cos (1/t)] , a T

0

sajátvektor

1

míg a sajátvektor sorozatnak nincs határértéke.

 alfejezetben a feladat közelíto  megoldásával foglalkozunk. Sajnos, a köA következo zelítések jóságát igen nehéz megítélni, ugyanis abból, hogy a deníciós egyenlet milyen pontossággal teljesül, egyéb információk hiányában általában semmire nem következtethetünk. 17.14. példa. Tekintsük az

" A ( )

mátrixot, ahol

 ≈

=

1

1



1

#

0 kicsi. Az A ( ) mátrix sajátértékei 1

sajátérték közelítése

µ = 1, a sajátvektoré pedig

±



,

sajátvektorai [1, ±



 ]T .

Legyen a

= [1, 0] . Ekkor

" #

0

= . kAx − µ xk2 =



x

T

2

Ha most például

 = 10−10 , akkor a reziduális öt nagyságrenddel alulbecsüli a tényleges 10−5

hibát.

17.31. megjegyzés. Mátrixok kondíciószámához hasonlóan sajátértékek kondíciószáma is bevezetheto,  ami egyszeres sajátérték esetén

ν ( λ1 ) ≈

k xk2 kyk2 , x T y

ahol x és y a jobb, illetve bal oldali sajátvektor (komplex sajátérték esetén x

T

helyett az ún.

hermitikus transzponáltat vesszük). Többszörös sajátérték kondíciószáma nem véges. Itt is arról van szó, hogy a sajátérték közelítés relatív hibája a relatív reziduális hiba kondíciószámszorosa.

17.3.1. A sajátérték feladat iteratív megoldása Csak valós elemu  mátrixok valós sajátértékeit és sajátvektorait vizsgáljuk. A módszerek  a komplex esetre is. értelemszeru  módosításokkal kiterjeszthetok

752

17. Tudományos számítások

A hatványmódszer

×n λ1 , . . . , λn

 származó módszer alapgondolata a következo.  Tegyük fel, hogy az n A von Mieses-tol  valós sajátértéke van. Ekkor a méretu  A valós mátrixnak pontosan n különbözo

sajátértékekhez tartozó x1 , . . . , xn sajátvektorok lineárisan függetlenek. Tegyük fel, hogy a sajátértékek kielégítik a

|λ1 | > |λ2 | ≥ . . . ≥ |λn | (0) ∈ Rn adott. A sajátvektorok lineáris függetlensége miatt v(0) egyértel= α1 x1 + α2 x2 + . . . + αn xn alakban. Tegyük fel, hogy α1 , 0. Képezzük a = Ak v(0) (k = 1, 2, . . .) sorozatot. A kiinduló feltevések miatt

feltételt és legyen v  muen  eloáll v

=

(k)

v

Av

(k−1)

(0)

=

(k)

v

Av

(k−1)

k−1 x1 1 k x1 2 1

+ α2 λk2−1 x2 + · · · + αn λkn−1 xn ) α1 λ + α λk2 x2 + · · · + αn λkn xn  k  k  λk1 α1 x1 + α2 λλ x2 + · · · + αn λλ xn .

= =

A(α1 λ

= ∈ Rn

Legyen y

2

n

1

1

, 0. Ekkor   k+1 P T λk1+1 α1 yT x1 + ni=2 αi λλ y xi   → λ1 . =  k P λk1 α1 yT x1 + ni=2 αi λλ yT xi T

 tetszoleges olyan vektor, amelyre y x1



T

y Av

(k)

T

=

yT v(k)

y v

(k+1)

yT v(k)

i

1

i

1

∈ Rn

(0)

Av

  kezdovektor felhasználásával a hatványmódszer a következo:

H  (A, v ´ ´

(0)

)

←0

1

k

2

while kilépési feltétel

4

=  ←k+1 (k) z ← Av(k−1)

5

válasszunk y vektort úgy, hogy y v

3

6 7 8

do k

T

(k−1)

, 0 teljesüljön

(k−1)

γk ← y z / y v (k) v ← z(k) /

z(k)

∞ (k) return γk , v (k)

T

T

A fentiek alapján fennáll, hogy (k)

v (k)

A v





x1 ,

γ k → λ1 . (k)

x1 konvergencián itt azt értjük, hogy v

hatásvonala Az

x 1 hatásvonalához. tart



(k)

y vektort általában egységvektornak választjuk úgy, hogy ha vi y

=

ei . Ha az y

(k−1)

=

(k−1)

v

választást használjuk, akkor



(k−1)



γk =

=

v(k)

, akkor legyen ∞  (k−1) Av / v(k−1)T v(k−1) a

(k−1)T

v

vektorhoz tartozó, ún. R v Rayleigh-hányadossal azonos. Ez a választás adja a λ1 sajátérték minimális reziduális hibájú közelítését (ami a 17.14. példa alapján persze nem

v

jelenti azt, hogy a legjobb választás lenne). Az eljárás konvergencia sebessége a (0)

keny a v

 érzé|λ2 /λ1 | nagyságától függ. A módszer erosen α1 = 0, akkor az eljárás nem konvergál a λ1

 kezdovektor megválasztására is. Ha

domináns sajátértékhez. Bizonyos mátrixosztályok esetén igazolták, hogy véletlenül válasz(0)

tott v

 kezdovektorok esetén 1 valószínuséggel  konvergál az eljárás. Komplex sajátértékek,

753

17.3. Sajátértékszámítás

λ1 esetén az eljárást módosítani kell. Az eljárás konvergenciáját gyorsí− σI ún. eltolt mátrixra alkalmazzuk, ahol σ alkalmasan megválasztott  konvergenszám. Az A − σ I mátrix sajátértékei ui. λ1 − σ, λ2 − σ, . . . , λn − σ és a megfelelo  |λ2 − σ| / |λ1 − σ|. Ez utóbbi σ ügyes megválasztásával kisebbé teheto,  mint cia tényezo: |λ2 /λ1 |.

illetve többszörös

tani lehet, ha az A

A hatványmódszert az



Av(k) − γk v(k)

2 krk k2



≤ kEk k2 =



=

v(k) 2

v(k) 2

kilépési feltétellel szokás leállítani. Ha a hatványmódszert szimultán alkalmazzuk az A mátrixra és wk

=



T

A

k

w0 , akkor





w(k)

2

v(k)

2 ν ( λ1 ) ≈ wT v k

λ1

a

T

k

kondíciószámának (lásd a 17.31. megjegyzést) egy becslését adja. Ekkor értelemsze-

ruen  a

ν (λ1 ) kEk k2 ≤  kilépési feltételt használjuk.  A hatványmódszert, amely igen elonyös lehet nagyméretu  ritka mátrixok esetén, leginkább a legnagyobb, ill. a legkisebb abszolút értéku  sajátértékek meghatározására használjuk.  Ez utóbbi a következoképpen történhet. Az A

−1

sajátértékei: 1/λ1 , . . . , 1/λn . Ezek közül a

legnagyobb abszolút értéku  sajátérték 1/λn lesz. Ezt az értéket tehát a hatványmódszernek

−1

A

-re való alkalmazásával megkaphatjuk, mégpedig úgy, hogy algoritmusának 4-edik sorát

 utasításra cseréljük: a következo (k)

oldjuk meg az Az

= v(k−1) egyenletrendszert z(k) -ra.

Az így módosított algoritmust nevezzük inverz hatványmódszernek. Nyilvánvaló, hogy alkalmas feltételek mellett

γk → 1/λn

(k)

és v



(k)

xn . Az Az

=

(k−1)

v

egyenletrendszer

 elonye,  megoldásához az LU-módszert célszeru  használni. Az algoritmus szembetun  o hogy nem kell A

−1

-et meghatározni.

− µI mátrixra alkalmazzuk, akkor (A − µI)−1 µ közelít, mondjuk λt -hez, akkor λi − µ → λi − λt . Ezért az eltolt

Ha az inverz hatványmódszert az eltolt A sajátértékei (λi



µ)−1 . Ha

mátrix sajátértékeire teljesül, hogy

|λt − µ|−1 > |λi − µ|−1

(i

, t) .

A konvergencia sebességét pedig a q hányados határozza meg. Ha

µ

= |λt − µ| / {max |λi − µ|}

elég közel van

λt -hez,

akkor q kicsinysége miatt az inverz

hatványiteráció rendkívül sebesen fog konvergálni. Ezt a tulajdonságot használhatjuk ki kö-

µ közelítése ismert. Ekkor feltéve, − µI) , 0, az A − µI mátrixra alkalmazzuk az inverz hatványmódszert. Annak (k) ellenére, hogy A − µ I közel szinguláris mátrix és ezért (A − µ I) z = v(k) nem oldható meg  sajátvektorok meghatározásánál, ha egy sajátérték zelíto hogy det (A

nagy pontossággal, az eljárás sok esetben igen jó sajátvektor közelítést ad.  eljárásokkal és egyéb módosításokkal Végül megjegyezzük, hogy rangszámcsökkento  az összes sajátérték-sajátvektor meghatározására is. a Mieses-eljárás alkalmassá teheto

754

17. Tudományos számítások

Ortogonalizálási eljárások  denícióra és tételre: Szükségünk van a következo 17.32. deníció. Egy Q

∈ Rn×n

T

mátrix ortogonális, ha Q Q

17.33. tétel (QR-felbontás). Minden A függetlenek, felbontható A

=

∈ Rn×m

=

I.

mátrix, amelynek oszlopvektorai lineárisan

QR alakban, ahol Q ortogonális mátrix és R felso  háromszög-

mátrix.

A QR-felbontást az LU-felbontáshoz hasonlóan felhasználhatjuk lineáris egyenletrendszer megoldására is. Ha ismert az A nemszinguláris mátrix QR-felbontása, akkor Ax QRx

=

b



Rx

=

=

T

 háromszögmátrixú egyenletrendszert kell Q b miatt csak egy a felso

megoldani. Egy mátrix QR-felbontására több módszer is létezik. A gyakorlatban a Givens- és Householder-módszereket , valamint az MGS-módszert használják. Az MGS- vagy módosított Gram–Schmidt-eljárás az önmagában is rendkívül fontos klasszikus Gram–Schmidt (CGS) ortogonalizációs eljárás numerikusan stabilizált, ekvivalens változata. Maga a feladat: az n a1 , . . . , am

∈ Rn (m ≤ n), lineárisan független vektorok o által kifeszített L {a1 , . . . , am } = λ a | λ ∈ R, j = 1 , . . . , m lineáris altérnek keresj j j j= 1 sük egy ortonormált új bázisát, azaz olyan lineárisan független q1 , . . . , qm vektorokat, amePm

lyekre fennáll: T

qi q j

=0

(i

,

j) , kqi k2

=1

(i

= 1, . . . , m)

és L {a1 , . . . , am }

=

L {q1 , . . . , qm }

.

m

A {qi }i=1 vektorrendszert ortonormált rendszernek mondjuk. A Gram-Schmidt eljárás alap gondolata a következo: Legyen r11

= ka1 k2

és q1

=

a1 /r11 . Tegyük fel, hogy a q1 , . . . , qk−1 vektorokat

P = ak − kj=−11 r jk q j alakban úgy, hogy q˜ k ⊥qi , Pk−1 T T T (i = 1, . . . , k − 1) teljesüljön. Kihasználva, hogy a azaz q ˜ qi = a qi − r jk q j qi = 0 j=1 k k T (i = 1, . . . , k − 1) eredményt. Véq1 , . . . , qk−1 ortonormált rendszer, kapjuk az rik = a qi k gül normáljunk: qk = q ˜ k / kq ˜ k k2 . n  Az a1 , . . . , am ∈ R lineárisan független vektorokra (m ≤ n) tehát az eljárást a következo  már eloállítottuk. Keressük a q ˜ k vektort q ˜k

formában algoritmizálhatjuk. CGS--G–S- ´  ´ (m, a1 , . . . , am ) 1 2 3 4 5 6 7

← 1 to m ← 1 to k − 1 T do rik ← a ai k ak ← ak − rik ai rkk ← kak k2 ak ← ak /rkk return a1 , . . . , am for k

do for i

755

17.3. Sajátértékszámítás

Az eljárás felülírja az ai vektorokat az ortonormált qi vektorokkal. A QR-felbontással való kapcsolatot az ak

=

Pk−1 j=1

r jk q j

a1 a2 a3

am

= = = .. . =

+ rkk qk

összefüggés adja meg. Ugyanis fennáll, hogy

q1 r11 q1 r13

+ q2 r22 + q2 r23 + q3 r33

q1 r1m

+ q2 r2m + . . . + qm rmm

q1 r12

.

Másképpen

  r11  0     0 A = [a1 , . . . , am ] = q1 , . . . , qm  | {z }  ..  .  0 |

.. .

... ... ... .. .

0

...

r12

r13

r22

r23

0

r33

.. .

0

{z

   r2m   r3m   = ..  .  rmm } r1m

QR

.

 A numerikusan stabilizált MGS módszer a következoképpen adható meg. CGS- ´ ´-G–S- ´  ´ (m, a1 , . . . , am ) 1 2 3 4 5 6 7

← 1 to m ← kak k2 ak ← ak /rkk for j ← k + 1 to m T do rk j ← a j ak a j ← a j − rk j ak return a1 , . . . , am

for k

do rkk

Az eljárás felülírja az ai vektorokat az ortonormált qi vektorokkal. Az MGS eljárás ekvivalens a CGS eljárással. Ugyanakkor numerikusan lényegesen stabilabb. Björck igazolta, ˆ mátrixra fennáll, hogy hogy m = n esetén a számított Q ˆT Q ˆ Q

= I + E,

kE k2  cond (A) u,

ahol u az egységnyi kerekítés mértéke. A QR-módszer A ma használt legfontosabb általános eljárás az összes sajátérték meghatározására. Megmu-

=

tatható, hogy a hatványmódszer általánosítása. Alapgondolata: az A1  olyan Ak+1 gonális hasonlósági transzformációkkal állítsunk elo

=

Q

−1 k

A-ból indulva orto-

Ak Qk

=

T k

Q Ak Qk so-

 rozatot, melynek alsó háromszögrésze diagonálmátrixhoz konvergál; foátlóbeli elemei tehát az A sajátértékeihez. A QR-módszernek nevezett eljárásban Qk az Ak  ortogonális tényezo.  Ekkor Ak+1 szereplo

=

T k

Q (Qk Rk )Qk

= Rk Qk .

=

Qk Rk -felbontásában

756

17. Tudományos számítások

QR- (A) ´

←1 ←A

1

k

2

A1

3

while kilépési feltétel

4

felbontást

← Rk Q k k ← k+1

5

Ak+1

6 7

= HAMIS = Q k Rk

do számítsuk ki az Ak

return Ak  tétel. Igaz a következo

17.34. tétel (Parlett). Ha az A mátrix diagonalizálható, továbbá sajátértékeire fennáll

|λ1 | > |λ2 | > · · · > |λn | > 0 és az X

−1

AX

=

diag(λ1 , λ2 , . . . , λn ) hasonlósági transzformáció X mátrixának létezik LU-

felbontása, akkor az Ak mátrixok alsó háromszög része konvergál egy diagonális mátrixhoz, amelynek diagonális elemei az A sajátértékei lesznek.

 része nem feltétlenül konvergál egy meghatározott mátrixhoz. Ha Az Ak mátrixok felso az A mátrixnak p számú azonos abszolút értéku  sajátértéke van, akkor az Ak mátrixok alakja bizonyos feltételek mellett a

  ×   0     0       0   

..

. × 0

∗ .. .

···



···

∗ .. . ∗ 0

× ..

0

alakhoz közelít, ahol a



.

0

 ×                  ×

(17.41)

elemekkel jelölt részmátrix elemei ugyan nem konvergálnak, de

sajátértékei igen. Ezt a részmátrixot lehet azonosítani és alkalmas módon kezelni. Ha valós mátrixunk van, akkor a karakterisztikus egyenletnek valós vagy komplex konjugált gyökei  Tehát az Ak sorozat a most lehetnek. Komplex konjugált gyökpárok esetén p legalább ketto. vázolt jelenséget fogja mutatni. A QR-felbontás nagyon számításigényes, költsége módszert

rendkívül

Hessenberg-alakú.

gazdaságosan

lehet

alkalmazni,

Θ(n3 ) ha

a

op. Ugyanakkor a QRkiinduló

A

mátrix

 felso

757

17.3. Sajátértékszámítás

17.35. deníció. Egy A

∈ Rn×n

       A =      

mátrix felso  Hessenberg-alakú, ha

...

a11

a1n

a21 0

a32

.. .

0

.. . ..

.

..

. ...

0

an−1,n−2

an−1,n−1

an−1,n

0

an,n−1

ann

       .     

Az A mátrixból hozzá hasonló, de már Hessenberg-alakú mátrixot többféleképpen is  eloállíthatunk. Az egyik legolcsóbb, kb. 5/6n op költségu  eljárás a Gauss-elimináción ala3

 Hessenberg-alakú mátrix QR-felbontása pul. Mivel egy felso

Θ(n2 ) op számítási költséget

 tétel biztosítja, hogy ha A felso  Hessenberg-alakú, akkor valamennyi igényel és a következo  lépéseként a felso  Hessenberg-alakra transzformálást Ak is az, érdemes az algoritmus elso elvégezni.

17.36. tétel. Ha A felso  Hessenberg-alakú és A

=

QR, akkor RQ is felso  Hessenberg-alakú.

A QR-módszer konvergenciája a hatványmódszerhez hasonlóan a sajátértékek

|λi+1 /λi |

hányadosaitól függ. Minthogy az A−σ I mátrix sajátértékei λ1 −σ, λ2 −σ, . . . , λn −σ, az ehhez kapcsolódó sajátérték hányadosok: |(λi+1

− σ) / (λi − σ)|. A σ ügyes megválasztásával ezek

 a hányadosok kicsivé tehetok, meggyorsítva ezáltal a konvergenciát. A Hessenberg-alakra  hozást és az eltolást is alkalmazó QR-módszer algoritmusa a következo: E -QR- (A) ´ ´

2

← U −1 AU k ← 1

3

while kilépési feltétel

1

H1

= HAMIS − σk I = Hk+1 ← Rk Qk + σk I k ← k+1

4

do számítsuk ki a Hk

5 6 7

 Hessenberg-alakú) (H1 felso

Qk Rk felbontást

return Hk A gyakorlatban a QR-módszert csak eltolásos formában használjuk. A

σi

paraméterek

megválasztására különféle stratégiák  léteznek. A leggyakrabban javasolt választás a követ  kezo:

(k) σk = hnn

Hk

=

h

(k)

hi j

in

i, j=1

.

Az A sajátvektorai a QR-módszer segítségével többféleképpen is könnyen meghatározhatók. Ezek részletezése az irodalomban megtalálható.

Gyakorlatok 17.3-1. Alkalmazzuk a hatványmódszert az A tékkel. Mi a huszadik lépés eredménye?

" =

1

1

0

2

#

" (0)

mátrixra a v

=

1 1

#  kezdoér-

758

17. Tudományos számítások

17.3-2. Alkalmazzuk a hatványmódszert, az inverz hatványmódszert és a QR-módszert a

  −4 −3  3  2 4

2

 −7   2   7

mátrixra.  o  gyakorlat mátrixára egy rögzített 17.3-3. Alkalmazzuk az eltolásos QR-módszert az eloz

σi = σ értékkel.

17.4. Numerikus programkönyvtárak és szoftvereszközök  algoritmusok számítógépi megA tudományos és mérnöki feladatok megoldásához vezeto valósítására, hatékony kódok írásának támogatására sokféle eszközt fejlesztettek ki. A fej lesztések egyik célja, hogy a programozókat tehermentesítsék a sokszor eloforduló prob lémák kódjainak megírásától. Vannak gyakran eloforduló feladatok, ezekre biztonságos,  szabványos rutinok készülnek, amelyek nyilvános programkönyvtárakból lejól muköd  o,  tölthetok. A fejlesztések egy másik iránya, hogy programozási nyelvként is funkcionáló, olyan szoftvereket hozzanak létre, amelyek segítségével algoritmusok kódolása egyszeruen,  gyorsan történhet. A lineáris algebrai szubrutin-gyujtemény  mellett megemlítjük a VISUAL NUMERICS (ez a régebbi, IMSL könyvtárból alakult) és a NAG könyvtárakat.

17.4.1. Szabványos lineáris algebrai szubrutinok A BLAS (Basic Linear Algebra Subprograms) programcsomagok alapgondolata a gyak ran eloforduló mátrix-vektor muveletek  hatékony implementálása és szabványosítása. A BLAS rutinokat eredetileg FORTRAN nyelven publikálták, de szabványos jellegük miatt  számos számítógépen és programkönyvtárban optimalizált gépi kódú rutinként is elérhetok. A BLAS rutinoknak három szintje létezik: - BLAS 1 (1979), - BLAS 2 (1988), - BLAS 3 (1989). Az egyes szintek az implementált mátrixmuveletek  muveletigény  nagyságrendjének felelnek meg. A BLAS 1-3 rutinok az adott muveletek  legjobb vagy legjobbnak tartott algoritmikus megvalósításait tartalmazzák. Az egyes algoritmusok és szintek helyes megválasztása nagymértékben befolyásolja az adott program hatékonyságát. A BLAS rutinoknak létezik ún. sparse-BLAS változata is ritka mátrixok kezelésére.  Megjegyezzük, hogy a BLAS 3 rutinokat foként blokkosított párhuzamos algoritmusokhoz fejlesztették ki. A BLAS rutinokat használva épülnek fel a LINPACK, EISPACK és LAPACK szabványosított lineáris algebrai programcsomagok. A LAPACK tartalmazza   a párhuzamosított változatok pedig a SCALAPACK csomagban találhatók. az elobbi kettot, Az említett programok megtalálhatók a NETLIB nyilvános programkönyvtárban, amelynek címe:

http:/www.netlib.org/index.html

759

17.4. Numerikus programkönyvtárak és szoftvereszközök

BLAS 1 rutinok

α ∈ R, x, y ∈ Rn . A BLAS 1 rutinok a legfontosabb vektormuveleteket  (z = α x, z = T x + y, dot = x y), az k xk2 kiszámítását, változócseréket, forgatásokat, valamint a rendkívül

Legyen

 gyakran eloforduló ún. saxpy muveletet  tartalmazzák, amelyet z deniál. A saxpy betuszó  jelentése: algoritmus valósítja meg:

= αx + y

 scalar alpha x plus y”. A saxpy muveletet  a következo ”

S(α, x, y)

← elemek [x] ← 1 to n do z [i] = α x [i] + y [i]

1

n

2

for i

3 4

return z A saxpy szoftver eredetu  muvelet.  A BLAS 1 rutinok muveletigénye 

BLAS 2 rutinok A BLAS 2 szint mátrix-vektor muveletei  y

= αAx + βy, y =

=

Ax, y

A

−1

x, y

=

T

Θ

Θ (n) op.

 

A x, A

2

n



op igényuek.  Az idetartozó muveletek  A

+ xyT

és ezek variánsai. Bizonyos mu

veletekben csak háromszögmátrixok szerepelhetnek. Két muvelettel  kell részletesen foglal vagy diadikus szorzat módosítási muvelet koznunk. A külso  A



A

+ xyT

A

∈ Rm×n , x ∈ Rm , y ∈ Rn



kétféleképpen is megvalósítható. Soronkénti vagy

”

i j” változat:

D-- ´ ´ ´ -

← sorok[A] ← 1 to m do A [i, :] ←

1

m

2

for i

3 4

A [i, :]

”- (A, x, y) ´

”

+ x [i] yT

return A

A :” jelölés az összes megengedett indexet jelöli. Esetünkben az 1 ” mazt, azaz A [i, :] az A mátrix teljes sorát. Oszloponkénti, vagy

”



n indexhal-

”- (A, x, y) ´

”

← oszlopok[A] ← 1 to n       do A :, j ← A :, j + y j x

1

n

2

for j

4

j

ji” változat:

D-- ´ ´ ´ -

3



return A





Itt A :, j az A j-edik oszlopát jelöli. Vegyük észre, hogy mindkét változat saxpy alapú.

760

17. Tudományos számítások

A gaxpy muvelet  a z

= y + Ax

x

∈ Rn , y ∈ Rm , A ∈ Rm×n



muvelet  elnevezése. A szintén szoftver eredetu  gaxpy muvelet  a

general A x plus y” ki”   fejezés rövidítése. A helyesen programozott gaxpy muvelet  általában elonyösebb a külso szorzat módosítási muveletnél,  ezért ennek használatára kell törekedni. A gaxpy muveletet   megvalósító algoritmus sémája a következo: G(A, x, y)

4

← oszlopok[A] ←y for j ← 1 to n     do z ← z + x j A :, j

5

return z

1

n

2

z

3

Vegyük észre, hogy oszloponként történik a számítás és a gaxpy muvelet  tulajdonképpen általánosított saxpy. BLAS 3 rutinok Ide tartoznak az C

Θ

  3

n

muveletigény  u  mátrix-mátrix, mátrix-vektor muveletek,  úgymint az

← αAB + βC, C ← αABT + βC, B ← αT −1 B (T

háromszögmátrix), valamint ezek külön-

féle variánsai. A BLAS 3 szint muveleteit  számos formában lehet algoritmizálni. Például a C B

=

∈R

AB mátrixszorzást legalább háromféleképpen tudjuk elvégezni. Legyen A

r ×n



m×r

R

,

.

M  ´ ´ -(A, B)

8

← sorok[A] ← oszlopok[A] n ← oszlopok[B] C [1 : m, 1 : n] ← 0 for i ← 1 to m do for j ← 1 to n do for k ← 1 to r       do C i, j ← C i, j + A [i, k] B k, j

9

return C

1 2 3 4 5 6 7

m r

Az algoritmus ci j -t az A mátrix i-edik sorának és a B mátrix j-edik oszlopának skalár szorzataként számítja ki (tulajdonképpen a deníciónak megfeleloen). Legyen most A, B, C oszloponként particionálva, azaz

= [a1 , . . . , ar ] B = [b1 , . . . , bn ] C = [c1 , . . . , cn ] A

Ekkor fennáll, hogy cj

=

r X

bk j ak k=1

(j

∈ Rm ) , r (bi ∈ R ) , m (ci ∈ R ) .

(ai

= 1, . . . , n) .

17.4. Numerikus programkönyvtárak és szoftvereszközök

761

 saxpy muveleTehát c j az A oszlopainak lineáris kombinációja. A szorzat pedig felépítheto  tek sorozatával. M  ´ ´ -(A, B)

8

← sorok[A] ← oszlopok[A] n ← oszlopok[B] C [1 : m, 1 : n] ← 0 for j ← 1 to n do for k ← 1 to r do for i ← 1 to m       do C i, j ← C i, j + A [i, k] B k, j

9

return C

1 2 3 4 5 6 7

m r

 ekvivalens formája mutatja, hogy ténylegesen gaxpy alapú A jki-algoritmus következo eljárás. M  (A, B) ´ ´ --´ ´

5

← sorok[A] ← oszlopok[B] C [1 : m, 1 : n] ← 0 for j ← 1 to n   do C :, j = gaxpy

6

return C

1 2 3 4

m n

Tekintsük most az A



A , B :, j



  , C :, j

= [a1 , . . . , ar ] (ai ∈ Rm ) és  T   b1   .   ..  (bi ∈ Rn ) B =    T

br

particionálásokat. Ekkor C

=

AB

=

Pr

k=1

T k

ak b

.

M  ´ ´ - ¨   -(A, B)

8

← sorok[A] ← oszlopok[A] n ← oszlopok[B] C [1 : m, 1 : n] = 0 for k ← 1 to r do for j ← 1 to n do for i ← 1 to m       C i, j ← C i, j + A [i, k] B k, j

9

return C

1 2 3 4 5 6 7

m r

 ciklus egy saxpy muveletet A belso  valósít meg, amennyiben ak többszörösét a C mátrix j-edik oszlopához adja.

762

17. Tudományos számítások

17.4.2. Matematikai szoftverek  integrált Ezen címszó alatt azon eszközöket értjük, melyek segítségével programfejlesztoi  környezetben, rendkívül könnyen, tömör formában írhatunk programokat. Elsosorban mate matikai feladatok kódolására fejlesztették ezeket, de olyan bovítésen mentek keresztül, hogy az élet számtalan területén alkalmazhatók. Például, a Nokia cégnél a mobiltelefonok alkat  részeinek automatikus tesztelését, minoségellen orzését MATLAB programokkal vezérlik.  alfejezetben adunk rövid ismertetést, mellette megemlítjük A MATLAB-ról a következo még a széles körben elterjedt MAPLE, a DERIVE és a MATEMATICA nevu  szoftvereket is. A MATLAB  kapta nevét. A név A MATLAB matematikai szoftver a MATrix LABoratory kifejezésbol  el benne. A kezdeti arra utal, hogy a mátrixszámítások rendkívül egyszeruen  végezhetok  változataiban egyetlen adattípust ismert: a komplex elemu  mátrixot. A késobbi verziókban már megjelentek a magasabb dimenziójú tömbök, cellák, a rekord típusú adatok és az ún.  szintu objektumok. Könnyen tanulható és kezdo  ismeretekkel is viszonylag bonyolult prog ramozási feladatok megoldását teszi lehetové. A mátrix muveletek  kódolása a szokásos matematikai alakban történik. Például, ha A és B két azonos méretu  mátrix, akkor az összegüket a C

=

A

+

 B utasítással írhatjuk elo.

 más progTulajdonképpen csak négy utasítást tartalmaz, mindegyik szemantikája ismeros  ramozási nyelvekbol: –aZ

= ki f e jezes ´ alakú egyszeru  értékadást,

– az if kifejezés, utasítások {else/elseif utasítások} end alakú feltételes utasítást, – a for ciklusváltozó értékeinek megadása, utasítások end alakú taxatív ciklust és – a while kifejezés, utasítások end alakú iteratív ciklust. Rendkívül sok beépített függvény segíti az egyes részfeladatok elvégzését, csak szemelvényszeruen  sorolunk fel néhány jellegzeteset: – max(A) az A minden oszlopából kiválasztja a legnagyobb elemet, – [v, s]

=eig(A) az A sajátértékeit és sajátvektorait adja vissza, az = b egyenletrendszert megoldását.

– A\b utasítás pedig az Ax

Igen hatékonyan lehet a mátrixokkal elemenként is muveleteket  végezni és kihasználni  a mátrix particionálási lehetoségeket. Például a A([2, 3], :)

= 1./A([3, 2], :)

utasítás felcseréli az A mátrix 2-ik és 3-ik sorát, miközben ezen sorok minden elemének a reciprokát veszi.  kívántunk adni a lehetoségekb   A fenti példákkal csak ízelítot ol, illetve bemutatni, hogy a rendelkezésre álló eszközökkel milyen kényelmesen lehet olyan feladatokat megol dani, amelyek programja, mondjuk, PASCAL nyelven meglehetosen körülményes lenne. A  beépített függvények körét ki-ki saját fejlesztésu  programokkal bovítheti. Az egyre magasabb verziószámú változatok egyre több nemlineáris feladatot megoldó függvényeket is tartalmaznak, ismét csak példákat említve: numerikus integrálásra, algebrai és differenciál egyenlet(rendszer) numerikus megoldására, optimalizálási, statisztikai feladatok megoldására szolgáló függvényt stb. Az egy családba sorolható feladatok jól tagolt könyvtárakba, készletcsomagokba (tool boxokba) vannak csoportosítva, melyeket állandóan bovítenek.

763

17. Feladatok

 Lehetoség van ritka mátrixok gazdaságos tárolására és az egyes beépített függvények  ritka mátrixos változatának hívására (a bemeneti adatoktól függoen automatikusan azt hasz jelentosen  nálja). Ezáltal a futási ido csökken.  A legújabb változatok már rendkívül gazdag grakus lehetoségeket is kínálnak.  a Megjelent az intervallum aritmetikai csomag is, letöltheto http:/www.ti3.tu-harburg.de\%7Erump\ intlab  helyrol.  Más programozási nyelven (pl. C vagy FORTRAN) megírt programok is beépíthetok, alkalmas illesztéssel.  Végül meg kell az elonyei között említeni, hogy nagyon jó súgóval rendelkezik. Többszintes tájékoztatást kérhet az alkalmazó, HTML fájlokban pedig egészen részletes leírások olvashatók a matematikai háttér magyarázatokkal együtt.

Feladatok 17-1. Túlcsordulás nélkül Írjunk olyan MATLAB programot, amely az

k x k2 =

P

n i=1

2

xi

1/2

normát a részeredmények

túlcsordulása nélkül minden olyan esetben kiszámítja, amelyben a végeredmény nem okoz túlcsordulást, ugyanakkor a végeredmény hibája sem nagyobb, mint ami az eredeti formulával adódik. 17-2. Becslés

− 3.330000x2 + 3.686300x − 1.356531 = 0 egyenletnek egy megoldása x1 = 1.01. A 3 2 perturbált x − 3.3300x + 3.6863x − 1.3565 = 0 egyenlet gyökei legyenek y1 , y2 , y3 , y4 . Adjunk becslést a mini | x1 − yi | eltérésre. Az x

3

17-3. Kétszeres szóhosszúság Tekintsünk olyan kétszeres szóhosszúságú aritmetikai rendszert, amelyben minden 2t jeggyel ábrázolt szám 2 db, egyenként t jegyu  szóban van tárolva. Tegyük fel, hogy a számítógép egyszerre csak t jegyu  számokat tud összeadni. Tegyük fel továbbá, hogy a túlcsordulást felismeri a gép. (i) Gondoljunk ki algoritmust két ilyen kétszeres szóhosszúságú szám összeadására, feltéve, hogy azok pozitívak.  (ii) Ha az ábrázolás megköveteli, hogy a számok mindkét felének legyen elojele, akkor módosítsuk az algoritmust úgy, hogy képes legyen mind a pozitív, mind a negatív számok  helyes összeadására és az összeg mindkét részének azonos elojele legyen. Feltehetjük, hogy a teljes összeg nem okoz túlcsordulást. 17-4. Auchmuty-tétel Írjunk MATLAB programot az Auchmuty-féle (lásd 17.22 tétel.) hibabecslésre és végezzük  vizsgálatokat. el a következo

= bi egyenletrend∈ Rn×n adott mátrix, bi = Ayi , yi ∈ Rn (i = 1, . . . , N) véletlen vektorok úgy, hogy kyi k∞ ≤ össze a tényleges ke xi − yi k, (i = 1, . . . , N) és becsült



β. Hasonlítsuk 2 T  megolxi ) hibákat, ahol e xi az Ax = bi egyenletrendszer közelíto ES T i = kr( e xi )k2 / A r(e 2

(i) Oldjuk meg kis és nagy kondíciószámú mátrixok esetén is az Ax szereket, ahol A

dása. Mekkora a ci számok minimuma, maximuma, átlaga és szórása? A kapott mennyisé-

764

17. Tudományos számítások

geket grakusan is ábrázoljuk. Javasolt értékek: n

≤ 200, β = 200, N = 40.

(ii) Vizsgáljuk meg a kondíciószám és a méret hatását. (iii) Végezzük el az (i), (ii) feladatokat a LINPACK és BLAS programcsomagok segítségével. 17-5. Hilbert-mátrix

= = 1/(i +

Tekintsük az Ax

b lineáris egyenletrendszert, ahol A a negyedrendu  Hilbert mátrix –

vagyis ai, j

j) – és b

=

[1, 1, 1, 1]

T

.

Ismert, hogy A rosszul kondicionált, ezért az

inverzét közelítsük B-vel, ahol

 202   −1212  B =   2121 −1131

−1212

2121

8181

−15271

−15271

29694

8484

−16968

Tehát az x megoldás egy x0 közelítése: x0

=

 −1131   8484   . −16968  9898

Bb. Ez nyilván nem a pontos eredmény, de még

csak nem is elfogadható közelítés, mert tudjuk, hogy a pontos megoldásnak is csak egész komponensei vannak. Alkalmazzuk az iteratív javítást az elfogadható egész megoldás megkeresésére, az A

−1

helyett annak B közelítését használva.

17-6. Konzisztens norma

kAk konzisztens norma és tekintsük az Ax = b egyenletrendszert. + ∆A szinguláris, akkor cond(A) ≥ kAk / k∆Ak.  (ii) Mutassuk meg, hogy 2”-es norma esetén (i)-ben az egyenloség áll

” −bxT /(bt x) és

A−1

2 kbk2 =

A−1 b

2 . Legyen

(i) Igazoljuk, hogy ha A

fenn, ha

∆A =

(iii) Az (i)-t felhasználva adjunk alsó korlátot a cond∞ (A)-ra, ha

  1  A =   −1 1

−1 ε ε

   ε  .  ε

1

17-7. Cholesky-módszer Tekintsük az Ax

= b lineáris egyenletrendszert, ahol  0 0 0  5.5 0  0 5.5 0 0 0   0 0 6.25 0 3.75 A =   0 0 0 5.5 0   0 0 3.75 0 6.25  3.5 1.5 0 0.5 0

3.5 1.5 0 0.5 0 5.5

      ,   

     b =     

1 1 1 1 1 1

      .   

Mivel A szimmetrikus, pozitív denit, ezért a Cholesky-módszerrel oldjuk meg. Adjuk meg a pontos A

=

LL

T

felbontást és az egyenletrendszer pontos megoldását. A Cholesky˜ közelítésre L ˜L ˜ T = A + F. Igazolható, hogy β felbontás során a pontos L helyett kapott L

≤e , ij

alapú, t mantisszahosszúságú lebegopontos  aritmetikában az F elemeire fennáll: fi j ahol

E

     1−t  = β    

11

0

0

0

0

3.5

0

11

0

0

0

1.5

0

0

0

0

0

0

0

0

0

11

0

0.5

0

0

0

0

0

0

3.5

1.5

0

0.5

0

11

      .   

765

17. Megjegyzések a fejezethez

IBM3033 típusú számítógépnél

β =

16 és t

=

 14. Adjunk korlátot a kapott x ˜ közelíto

megoldás relatív hibájára. 17-8. Bauer–Fike-tétel Legyen

      A =     

10

10 9

10 8

10

..

.

..

.

2

10

ε

1

       .   

ε = 10−5 , 10−6 , 10−7 , 0 esetén. (ii) Vizsgáljuk meg a Bauer–Fike tétel becslését az A = A(0) mátrixhoz képest. (i) Vizsgáljuk meg a sajátértékek megváltozását az 17-9. Sajátérték Határozzuk meg B

=

T

AA

 n értékekre a sajátértékeit véletlen A mátrixokkal különbözo

MATLAB eig rutinjával, ahol A



R

n×n

adott mátrix. hHatározzuk imeg a B

sajátértékeit, ha Ri véletlen mátrix, amelynek elemei a (i

= 1, . . . , N). Mekkora B és a B + Ri

−10−5 , 10−5

+

Ri mátrix

intervallumba esnek

sajátértékeinek maximális eltérése? Milyen pontos a

Bauer-Fike-tétel becslése? Javasolt értékek: N

= 10, 5 ≤ n ≤ 200.

Hogyan alakulnak az eredmények a kondíciószám függvényében? Tapasztalunk-e függést az n rendszámtól? Ábrázoljuk grakusan a maximális eltéréseket és a Bauer–Fike-tétel becslését.

Megjegyzések a fejezethez  megoldására alkalmazott utólagos hibabecslések A lineáris egyenletrendszerek közelíto   nem teljesen megbízhatók. Demmel, Diament és Malajovich

kimutatták, hogy az

Θ

2

n

 esetén mindig vannak olyan esetek, amikor a becslés megköltségu  kondíciószámbecslok bízhatatlan (a becslés hibája meghalad egy meghatározott nagyságrendet) [107].  megoldására vonatkozó iteratív javítás elso  isA lineáris egyenletrendszerek közelíto  mert alkalmazása Fox, Goodwin, Turing és Wilkinson nevéhez fuz  odik (1946). A tapasztalatok szerint a reziduális hiba csökkenése nem monoton. A módszer alkalmazásának egy lehetséges változata a pointeres LU-módszerrel összekapcsolva a [441] könyvben is szerepel.  összefoglalását tartalAz iterációs módszerek elméletének és alkalmazásainak kitun  o  átmazzák Young , illetve Hageman és Young könyvei [503], [188]. A téma szoftverelvu tekintését adják Barett, Berry és társaik [31]. Itt hívjuk fel a gyelmet Andreas Frommer könyvére is, amely az iteratív módszerek párhuzamosítására is kitér [141]. A QR-módszer konvergenciájára vonatkozó 17.34. tételnél lényegesen jobb konvergencia eredmények is ismertek. Számos, a QR-módszerrel rokon eljárás ismert a sajátérték feladat megoldására (lásd például [492], [488]). Ezek közül az egyik legismertebb, az ún.  LR módszer, amit pozitív denit hermitikus mátrixra elonyös alkalmazni. Lényege: állítsuk  az Ak elo

=



LL Cholesky-felbontást, majd legyen Ak+1

=



L L.

Ismeretesek implicit, dupla eltolást alkalmazó, a QR-módszerhez hasonló eljárások is. Mindenesetre már a 3 × 3-as Hessenberg-alakú mátrixok között is van példa, hogy komplex

766

17. Tudományos számítások

 el konvergencia – azaz a (17.41)-ben sajátértékek esetén többszörös eltolással sem érheto megmutatott alak – pontos számítások mellett, amint azt Batterson kimutatta [34]:

  0.83116322648071935   0.35613892213531548 0

−0.34924697025783983 0.86568478391818912 −0.35613892213531548

0.06972435460743861 0.34924697025783983 0.83116322648071935

    .

(a kerekítési hibák miatt, paradox módon, mégis tapasztalható igen lassú konvergencia).

17. Megjegyzések a fejezethez

767

768

17. Tudományos számítások

Irodalomjegyzék

[1] S. Abiteboul, V. Vianu. Foundations of Databases. Addison-Wesley, 1995. 534, 535 [2] L. Addario-Berry, B. Chor, M. Hallett, J. Lagergren, A. Panconesi, T. Wareham. Ancestral maximum likelihood of phylogenetic trees is hard. Lecture Notes in Bioinformatics, 2812:202–215, 2003. 577 [3] R. G. Addie, M. Zukerman, T. Neame. Broadband traffic modeling: Simple solutions to hard problems. IEEE Communications Magazine, (8):88–95, 1998. 221 [4] M. Agrawal, N. Kayal, N. M. Saxena. PRIMES is in P. Available at http://www.cse.iitk.ac.in/users/ manindra/primality.ps, 2002. 123 [5] A. Aho, C. Beeri, J. D. Ullman. The theory of joins in relational databases. ACM Transactions on Database Systems, 4(3):297–314, 1979. 534 [6] A. V. Aho, J. E. Hopcroft, J. D. Ullman. The Design and Analysis of Computer Algorithms. Addison-Wesley, 1974. Magyarul: Számítógép-algoritmusok tervezése és analízise. Muszaki  Könyvkiadó, 1982. 9 [7] R. K. Ahuja, T. L. Magnanti, J. B. Orlin. Network Flows: Theory, Algorithms, and Applications. Prentice Hall, 1993. 604 [8] A. G. Akritas. Elements of Computer Algebra with Applications. John Wiley & Sons, 1989. 93 [9] T. Akutsu. Dynamic programming algorithms for RNA secondary prediction with pseudoknots. Discrete Applied Mathematics, 104:45–62, 2000. 578 [10] E. Althaus, A. Caprara, H. Lenhof, K. Reinert. Multiple sequence alignment with arbitrary gap costs: Computing an optimal solution using polyhedral combinatorics. Bioinformatics, 18:S4–S16, 2002. 576  kiadása, 1998. 604 [11] I. Althöfer. 13 Jahre 3-Hirn. A szerzo [12] I. Althöfer. List-3-Hirn vs. grandmaster Yussupov – report on a very experimental match. ICCA Journal, 21:52–60 and 131–134, 1998. 604 [13] I. Althöfer. Improved game play by multiple computer hints. Theoretical Computer Science, 313:315–324, 2004. 604 [14] I.

Althöfer,

F.

Berger,

S.

Schwarz.

Generating

True

Alternatives

with

a

http://www.minet.uni-jena.de/Math-Net/reports/shadows/02-04report.html, 2002. 604

Penalty

Method.

[15] I. Althöfer, J. de Koning, J. Lieberum, S. Meyer-Kahlen, T. Rolle, J. Sameith. Five visualisations of the k-best mode. ICCA Journal, 26:182–189, 2003. 604 [16] G. M. Amdahl. Validity of the single-processor approach to achieving large-scale computer capabilities. In AFIPS Conference Proceedings, 30. kötet, 483–485. o., 1967. 267 [17] D. Anick, D. Mitra, M. Sondhi. Stochastic theory of a data handling system with multiple sources. Bell System Technical Journal, 61:1871–1894, 1982. 221 [18] V. Arlazanovan. A. Dinic, M. Kronrod, I. Faradzev. On economic construction of the transitive closure of a directed graph. Doklady Academii Nauk SSSR, 194:487–488, 1970. 576 [19] W. Armstrong. Dependency structures of database relationships. In Proceedings of IFIP Congress, 580– 583. o. North Holland, 1974. 534 [20] V. Arvind, P. Kurur. Graph isomorphism is in SPP. In Proceedings of the 43rd IEEE Symposium on Foundations of Computer Science, 743–750. o. IEEE Computer Society Press, 2002. 159 [21] K. Atteson. The performance of the neighbor-joining method of phylogeny reconstruction. Algorithmica, 25(2/3):251–278, 1999. 578 [22] J-P. Aubin. Mathematical Methods of Game and Economic Theory. North-Holland, 1979. 360

770

Irodalomjegyzék

[23] L. Babai. Trading group theory for randomness. In Proceedings of the 17th ACM Symposium on Theory of Computing, 421–429. o. ACM Press, 1985. 123, 124 [24] L. Babai, S. Moran. Arthur-Merlin games: A randomized proof system, and a hierarchy of complexity classes. Journal of Computer and Systems Sciences, 36(2):254–276, 1988. 123, 124 [25] I. Bach. Formális nyelvek (Formal languages). Typotex, 2001. 576 [26] B. Baker. A tight asymptotic bound for next-t decreasing bin-packing. SIAM Journal on Algebraic and Discrete Methods, 2(2):147–152, 1981. 502 [27] E. Balas. Sequencing via disjunctive graphs: an implicit enumeration algorithm. Operation Research, 17:941–953, 1969. 414 [28] B. Balkenhol, S. Kurtz. Universal data compression based on the Burrows–Wheeler transform: theory and practice. IEEE Transactions on Compututers, 49(10):1043–1053–953, 2000. 454 [29] J. Banks, J. Carson, B. Nelson. Discrete-Event Simulation. Prentice Hall, 1996. 221  [30] W. Banzhaf. Interactive evolution. In T. Back, D. B. Fogel, Z. Michalewicz, T. Baeck (szerkesztok), Handbook of Evolutionary Computation. IOP Press, 1997. 604 [31] R. Barett, M. Berry, T. F. Chan, J. Demmel, J. Donato, J. Dongarra, V. Eijkhout, R. Pozzo, C. Romine, H. van der Vorst. Templates for the Solution of Linear Systems: Building Blocks for Iterative Methods. SIAM, 1994. 765 [32] J. R. Barker, G. B. McMahon. Scheduling the general job-shop. Management Science, 31:594–598, 1985. 414, 415 [33] T. Bartha, A. Pataricza. Formális módszerek az informatikában (Formal Methods in Informatics). Typotex, 2004. 455 [34] S. Batterson. Convergence of the shifted QR algorithm on 3

× 3 normal matrices.

, 58, 1990. 766

[35] C. Beeri. On the membership problem for functional and multivalued dependencies in relational databases. ACM Transactions on Database Systems, 5:241–259, 1980. 534 [36] C. Beeri, P. Bernstein. Computational problems related to the design of normal form relational schemas. ACM Transactions on Database Systems, 4(1):30–59, 1979. 534 [37] C. Beeri, M. Dowd. On the structure of armstrong relations for functional dependencies. Journal of ACM, 31(1):30–46, 1984. 534 [38] C. Beeri, R. Fagin, J. Howard. A complete axiomatization for functional and multivalued dependencies. In ACM SIGMOD Symposium on the Management of Data, 47–61. o., 1977. 534 [39] T. C. Bell, I. H. Witten, J. G. Cleary. Modeling for text compression. Communications of the ACM, 21:557– 591, 1989. 454 [40] T. C. Bell, I. H. Witten, J. G. Cleary. Text Compression. Prentice Hall, 1990. 454, 455  [41] A. Benczúr A. Kiss, T. Márkus. A relációs adatmodell függoségeinek egy általános osztálya és implikációs problémáinak vizsgálata. Alkalmazott Matematikai Lapok, 13:291–312, 1987-88. 535 [42] J. Beran. Statistics for Long-Memory Processes. Monographs on Statistics and Applied Probability. Chapman & Hall, 1986. 221 [43] J. Beran, R. Sherman, M. Taqqu, W. Willinger. Long-range dependence in variable-bit-rate video traffic. IEEE Transactions on Communications, 43:1566–1579, 1995. 221 [44] F. Berger. k alternatives instead of k shortest paths. Master's thesis, Friedrich Schiller Egyetem, Jéna, Matematikai és Informatikai Kar, 2000. Diplomamunka. 604 [45] K. A. Berman, J. L. Paul. Sequential and Parallel Algorithms. PWS Publishing Company, 1996. 266 [46] A. Beygelzimer, L. Hemaspaandra, C. Homan, J. Rothe. One-way functions in worst-case cryptography: Algebraic and security properties are on the house. SIGACT News, 30(4):25–40, 1999. 123 [47] A. Békéssy, J. Demetrovics. Contribution to the theory of data base relations. Discrete Mathematics, 27(1):1–10, 1979. 534 [48] A. Békéssy, J. Demetrovics. Eloadások  adatbázis szerkezetekrol  (Lectures on data base structures). ELTE Eötvös Kiadó, 1999. 535 [49] A. Békéssy, J. Demetrovics. Adatbázis szerkezetek (Data Base structures). Akadémiai Kiadó, 2004. Nyomdában. 535 [50] J. Blazewicz, K. Ecker, E. Pesch, G. Schmidt, J. Weglarz. Scheduling Computer and Manufacturing Processes. Springer-Verlag, 2001 (2. kiadás). 415 [51] L. A. Bélády. A study of replacement algorithms for a virtual storage computer. IBM Systems Journal, 5(2):78–101, 1965. 502

771

Irodalomjegyzék

[52] L. A. Bélády, R. Nelson, G. S. Shedler. An anomaly in space-time characteristics of certain programs running in paging machine. Communications of the ACM, 12(1):349–353, 1969. 502 [53] J. Blinn. A generalization of algebraic surface drawing. ACM Transactions on Graphics, 1(3):135–256, 1982. 683, 684 [54] J. Bloomenthal. Introduction to Implicit Surfaces. Morgan Kaufmann Publishers, 1997. 683 [55] D. Boneh. Twenty years of attacks on the RSA cryptosystem. Notices of the AMS, 46(2):203–213, 1999. 123 [56] B. Borchert, L. Hemaspaandra, J. Rothe. Restrictive acceptance suffices for equivalence problems. London Mathematical Society Journal of Computation and Mathematics, 86:86–95, 2000. 159 [57] R. P. Brent. The parallel evaluation of general arithmetic expressions. Journal of the ACM, 21:201–206, 1974. 267 [58] J. E. Bresenham. Algorithm for computer control of a digital plotter. IBM Systems Journal, 4(1):25–30, 1965. 684 [59] G. Brooks, C. R. White. An algorithm for nding optimal or near optimal solutions to the production scheduling problem. Journal of Industrial Engineering, 16:34–40, 1965. 414 [60] L. E. J. Brouwer. Über Abbildung von Manningfaltigkeiten. Mathematische Annalen, 97–115. o., 1912. 359 [61] P. Bruckner. Scheduling Algorithms. Springer-Verlag, 1998. 413 [62] B. Buchberger. Ein algorithmus zum auffinden der basiselemente des restklassenringes nach einem nulldimensionalen polynomideal, 1965. PhD disszertáció, Leopold-Franzens-Universität, Innsbruck. 92 [63] M. Burrows, D. J. Wheeler. A block-sorting lossless data compression algorithm. Research Report 124, http://gatekeeper.dec.com/pub/DEC/SRC/research-reports/abstracts/src-rr-124.html, 1994. 454

[64] L. Buttyán, I. Vajda. Kriptográa és alkalmazásai (Cryptography and its Applications). Typotex, 2004. 124 [65] CACI. COMNET III. CACI Products Co., 1997. 221 [66] Calgary. The Calgary/Canterbury Text Compression. ftp://ftp.cpsc.ucalgary.ca/pub/projects/text.compression. corpus, 2004. 455 [67] Canterbury. The Canterbury Corpus. http://corpus.canterbury.ac.nz, 2004. 455 [68] J. Carlier, E. Pinson. Algorithm for solving the job-shop problem. Management Science, 35:164–176, 1989. 414, 415 [69] J. L. Carter, M. N. Wegman. Universal classes of hash functions. Journal of Computer and System Sciences, 18(2):143–154, 1979. 159 [70] E. Catmull, J. Clark. Recursively generated B-spline surfaces on arbitrary topological meshes. ComputerAided Design, 10:350–355, 1978. 683 [71] B. F. Caviness. Computer algebra: past and future. Journal of Symbolic Computations, 2:217–263, 1986. 93 [72] R. Chandra, L. Dagum, D. Kohr, D. Maydan, J. McDonald, R. Menon. Parallel Programming in OpenMP. Morgan Kaufmann Publishers, 2000. 267 [73] J. Charlton, C.

C. Death. A method of solution for general machine scheduling problems. Operations

Research, 18:689–707, 1970. 414 [74] B. Chazelle. Triangulating a simple polygon in linear time. Discrete and Computational Geometry, 6(5):353–363, 1991. 683 [75] S. M. Christensen. Resources for computer algebra. Computers in Physics, 8:308–315, 1994. 93 [76] D. Christie. Sorting permutations by block-interchanges. Information Processing Letters, 60(4):165–169, 1996. 578  [77] E. F. Codd. Further normalization of the data base relational model. In R. Rustin (szerkeszto), Courant Computer Science Symposium 6: Data Base Systems, 33–64. o. Prentice Hall, 1972. 534  Courant Compu[78] E. F. Codd. Relational completeness of database sublanguages. In R. Rustin (szerkeszto), ter Science Symposium 6: Data Base Systems, 65–98. o. Prentice Hall, 1972. 534 [79] E. F. Codd. Recent investigations in relational data base systems. In Information Processing 74, 1017–1021. o. North-Holland, 1974. 534 [80] E. F. Codd. A relational model of large shared data banks. Communications of the ACM, 13(6):377–387, 1970. 534

772

Irodalomjegyzék

[81] E. F. Codd. Normalized database structure: A brief tutorial. In ACM SIGFIDET Workshop on Data Description, Access and Control, 24–30. o., 1971. 534 [82] E. Coffman. Computer and Job Shop Scheduling. John Wiley & Sons, 1976. 415, 502 [83] E. Coffman, M. Garey, D. Johnson. An application of bin-packing to multiprocessor scheduling. SIAM Journal on Computing, 7:1–17, 1978. 414 [84] E. G. Coffman, J. Csirik, G. J. Woeginger. Approximate solutions to bin packing problems. In P. M.  Pardalos, M. G. C. Resende (szerkesztok), Handbook of Applied Optimization, 607–615. o. Oxford University Press, 2002. 414  [85] A. M. Cohen, L. van Gasten, S. Lunel (szerkesztok). Computer Algebra for Industry 2, Problem Solving in Practice. John Wiley & Sons, 1995. 93  [86] A. M. Cohen (szerkeszto). Computer Algebra for Industry: Problem Solving in Practice. John Wiley & Sons, 1993. 93 [87] S. Cook. The complexity of theorem proving procedures. In Proceedings of the Third Annual ACM Symposium on Theory of Computing, 151–158. o. ACM Press, 1971. 158 [88] D. Coppersmith. Small solutions to polynomial equations, and low exponent RSA vulnerabilities. Journal of Cryptology, 10(4):233–260, 1997. 123 [89] T. H. Cormen, C. E. Leiserson, R. L. Rivest. Introduction to Algorithms. The MIT Press/McGraw-Hill,  Kiadó, 2003, negyedik kiadás). 9, 266 1990 (Magyarul: Algoritmusok. Muszaki [90] T. H. Cormen, C. E. Leiserson, R. L. Rivest, C. Stein. Introduction to Algorithms. The MIT Press/McGrawHill, 2003 (Második kiadás negyedik, javított utánnyomása. Magyarul: Új algoritmusok. Scolar Kiadó, 2003). 9, 92, 93, 159, 263, 454, 502, 576, 716 [91] T. M. Cover, J. A. Thomas. Elements of Information Theory. John Wiley & Sons, 1991. 455 [92] H. S. M. Coxeter. Projective Geometry. University of Toronto Press, 1974 (2. kiadás). 683 [93] R. Cristescu, G. Marinescu. Unele aplicatii ale teoriei distributilor. Editura academiei republicii socialiste, Magyarul: Bevezetés a disztribúcióelméletbe és alkalmazásaiba, Muszaki  könyvkiadó, 1969). 716 [94] M. Crovella, A. Bestavros. Self-similarity in world wide web traffic: Evidence and possible causes. IEEE/ACM Transactions on Networking, 5(6):835–846, 1997. 221

[95] I. Csiszár, J. Körner. Coding Theorems for Discrete Memoryless Systems. Akadémiai Kiadó, 1981 (Magyarul: Információelmélet. Tankönyvkiadó, 1980). 455 [96] D. E. Culler, R. M. Karp, D. Patterson, A. Sahay, E. E. Santos, K. E. Schauser, R. Subramonian, T. von Eicken. Logp: A practical model of parallel computation. Communication of the ACM, 39(11):78–85, 1996. 267 [97] D. E. Culler, J. P. Singh, A. Gupta. Parallel Computer Architecture: A Hardware/Software Approach. Morgan Kaufman Publisher, 1983. 267 [98] E. Dantsin, A. Goerdt, R. Kannan, J. Kleinberg, C. Papadimitriou, P. Raghavan, U. Schöning. A deterministic (2 − 2/(k

+ 1))n

algorithm for k-sat based on local search. Theoretical Computer Science, 289(1):69–83,

2002. 158, 159 [99] A. Darte, Y. Robert, F. Vivien. Scheduling and Automatic Parallelization. Birkhäuser Boston, 2000. 310 [100] J. Davenport, Y. Siret, E. Tournier, E.. Computer Algebra: Systems and Algorithms for Algebraic Computation. Academic Press, 2000. 93 [101] M. de Berg. Efficient Algorithms for Ray Shooting and Hidden Surface Removal. PhD thesis, Rijksuniversiteit te Utrecht, 1992. 683 [102] M. de Berg, M. van Kreveld, M. Overmars, O. Schwarzkopf. Computational Geometry: Algorithms and Applications. Springer-Verlag, 2000. 683 [103] C. Delobel. Normalization and hierarchical dependencies in the relational data model. ACM Transactions on Database Systems, 3(3):201–222, 1978. 534 [104] J. Demetrovics, Gy. O. H. Katona, A. Sali. Minimal representations of branching dependencies. Discrete Applied Mathematics, 40:139–153, 1992. 535 [105] J. Demetrovics, Gy. O. H. Katona, A. Sali. Minimal representations of branching dependencies. Acta Scientiarum Mathematicorum (Szeged), 60:213–223, 1995. 535 [106] J. Demetrovics, Gy. O. H. Katona, A. Sali. Design type problems motivated by database theory. Journal of Statistical Planning and Inference, 72:149–164, 1998. 535 [107] J. Demmel, D. Malajovich. On the complexity of computing error bounds. Foundations of Computational Mathematics, 1:101–125, 2001. 765

Irodalomjegyzék

773

[108] P. Denning. Virtual memory. Computing Surveys, 2(3):153–189, 1970. 501  Gy. Szabó. Bevezetés a térinformatikába (Introduction to Geoinformatics). Nemzeti Tan[109] A. Detrekoi, könyvkiadó, 1995. 716  Gy. Szabó. Térinformatika (Geoinformatics). Nemzeti Tankönyvkiadó, 2003 (második kia[110] Á. Detrekoi, dás). 716 [111] W. Diffie, M. E. Hellman. New directions in cryptography. IEEE Transactions on Information Theory Theory, IT-22(6):644–654, 1976. 122 [112] D. Doernberg. Interview with Donald Knuth. Computer Literacy, 1993. 579 [113] N. Duffield, N. Oconnell. Large deviation and overow probabilities for the general single-server queue, with applications. Mathematical Proceedings of the Cambridge Philosophical Society, 118:363–374, 1995. 221 [114] D. Duffy, A. McIntosh, M. Rosenstein, W. Willinger. Statistical analysis of ccsn/ss7 traffic data from working ccs subnetworks. IEEE Journal on Selected Areas Communications, 12:544–551, 1994. 221 [115] J. Duncan. The Elements of Complex Analysis. John Wiley & Sons, 1968 (Magyarul: Bevezetés a komplex függvénytanba, Muszaki  Könyvkiadó, 1974). 716 [116] R. Durbin, S. Eddy, A. Krogh, G. Mitchison. Biological Sequence Analysis. University Press, 1998. 576 [117] N. Dyn, J. Gregory, D. Levin. A buttery subdivision scheme for surface interpolation with tension control. ACM Transactions on Graphics, 9:160–169, 1990. 683 [118] M. Effros, K. Viswesvariah, S. Kulkarni, S. Verdú. Universal lossless source coding with the burrows– wheeler transform. IEEE Transactions on Information Theory Theory, 48(5):1061–1081, 2002. 454 [119] S. N. Elaydi. An Introduction to Difference Equations. Springer-Verlag, 1999 (2. kiadás). 37  M. Steel, L. Székely, T. Warnow. Local quartet splits of a binary tree infer all quartet splits via one [120] P. Erdos, dyadic inference rule. Computers and Articial Intelligence, 16(2):217–227, 1997. 578 [121] A. Erramilli, O. Narayan, W. Willinger. Experimental queueing analysis with long-range dependent packettraffic. IEEE/ACM Transactions on Networking, 4(2):209–223, 1996. 221

[122] R. Fagin. Multivalued dependencies and a new normal form for relational databases. ACM Transactions on Database Systems, 2:262–278, 1977. 534 [123] R. Fagin. Armstrong databases. In Proceedings of IBM Symposium on Mathematical Foundations of Computer Science, 1982. 534 [124] R. Fagin. Horn clauses and database dependencies. Journal of ACM, 29(4):952–985, 1982. 534 [125] G. Farin. Curves and Surfaces for Computer Aided Geometric Design. Morgan Kaufmann Publishers, 1998. 683 [126] J. Felsenstein. Inferring Phylogenies. Sinauer Associates, Inc., 2003. 576 [127] S. Fenner, L. Fortnow, S. Kurtz. Gap-denable counting classes. Journal of Computer and System Sciences, 48(1):116–148, 1994. 159 [128] R. Fernando. GPUGems: Programming Techniques, Tips, and Tricks for Real-Time Graphics. AddisonWesley, 2004. 684 [129] M. L. Fisher. Optimal solution of scheduling problems using lagrange multipliers: Part I. Operations Research, 21:1114–1127, 1973. 414, 415 [130] M. L. Fisher. Optimal solution of scheduling problems using lagrange multipliers: Part II,. In S. E. Elmagh Symposium on the Theory of Scheduling and Its Applications. Springer-Verlag, 1973. 414 raby (szerkeszto), [131] Z. Fülöp. Formális nyelvek és szintaktikus elemzésük (Formal Languages and their Syntactical Analysis). Polygon, 2000. 576 [132] M. J. Flynn. Very high-speed computer systems. Proceedings of the IEEE, 5(6):1901–1909, 1966. 266 [133] J. D. Fooley, A., S. K. Feiner, J. F. Hughes. Computer Graphics: Principles and Practice. Addison-Wesley, 1990. 684 [134] F. Forgó, J. Szép, F. Szidarovszky. Introduction to the Theory of Games: Concepts, Methods and Applications. Kluwer Academic Publishers, 1999. 360  és Winkler Zoltán (szerkeszto),  5th [135] P. Fornai, A. Iványi. Bélády's anomaly is unbounded. In Kovács Elod International Conference on Applied Informatics, 65–72. o. Molnár és társa, 2002. 502 [136] S. Fortune, J. Wyllie. Parallelism in random access machines. In Proceedings of the Tenth Annual ACM Symposium on Theory of Computing, 114–118. o., 1978. 267

774

Irodalomjegyzék

[137] I. Foster, C. Kesselman. The Grid: Blueprint for a New Computing Infrastructure. Morgan Kaufman Publisher, 2004 (2. kiadás). 267 [138] I. Foster, C. Kesselman, J. M. Nick, S. Tuecke. The physiology of the grid: An open grid services architecture for distributed systems integration. Available at www.globus.org/research/papers/ogsa.pdf, 2002. 267 [139] D. K. Friesen. Tighter bounds for the multit processor scheduling algorithm. Journal of Algorithms, 7:35– 59, 1984. 414 [140] D. K. Friesen, M. A. Langston. Evaluation of a multit-based scheduling algorithm. Journal of Algorithms, 7:35–59, 1986. 414 [141] A. Frommer. Lösung linearer Gleichungssysteme auf Parallelrechnern. Vieweg Verlag, 1990. 765 [142] H. Fuchs, Z. M. Kedem, B. F. Naylor. On visible surface generation by a priory tree structures. In Computer Graphics (SIGGRAPH '80 Proceedings), 124–133. o., 1980. 684 [143] A. Fujimoto, T. Takayuki, I. Kansey. ARTS: accelerated ray-tracing system. IEEE Computer Graphics and Applications, 6(4):16–26, 1986. 683 [144] S. Gajdos. Adatbázisok (Data Bases). Muegyetemi  Kiadó, 2001. 535  [145] T. Gal, T. Stewart, T. Hanne (szerkesztok). Multicriteria Decision Making. Kluwer Academic Publisher, 1999. 604 [146] G. Galambos. Operációs rendszerek (Operating Systems). Muszaki  Könyvkiadó, 2003. 502 [147] H. Garcia-Molina, J. D. Ullman. Database System Implementation. Prentice Hall, 2000. Magyarul: Adatbázisrendszerek megvalósítása. Panem, 2001. 535 [148] M. R. Garey, R. L. Graham. Performance guarantees for scheduling algorithm. Operations Research, 26:3– 21, 1978. 415 [149] M. R. Garey, D. S. Johnson. Computers and Intractability: A Guide to the Theory of NP-Completeness. W. H. Freeman, 1979. 10, 158 [150] W. H. Gates, C. Papadimitriou. Bounds for sorting by prex reversals. Discrete Mathematics, 27:47–57, 1979. 578 [151] F. Gécseg, I. Peák. Algebraic Theory of Automata. Akadémiai Kiadó, 1972. 501 [152] K. O. Geddes S. Czapor, G. Labahhn. Algorithms for Computer Algebra. Kluwer Academic Publishers, 1992. 92, 93 [153] P. B. Gibbons, Y. Matias, V. Ramachandran. Can a shared-memory model serve as a bridging model for parallel computation. Theory of Computing Systems, 32(3):327–359, 1999. 267 [154] A. Glassner. An Introduction to Ray Tracing. Academic Press, 1989. 683 [155] A. Gál, S. Halevi, R. Lipton, E. Petrank. Computing from partial solutions. In Proceeding of the 14th Annual IEEE Conference on Computational Complexity, 34–45. o. IEEE Computer Society Press, 1999. 159 [156] D. E. Goldberg. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley, 1989. 604 [157] N. Goldman, J. Thorne, D. Jones. Using evolutionary trees in protein secondary structure prediction and other comparative sequence analyses. Journal of Molecular Biology, 263(2):196–208, 1996. 577  [158] O. Goldreich. Randomness, interactive proofs, and zero-knowledge – a survey. In R. Herken (szerkeszto), The Universal Turing Machine: A Half-Century Survey, 377–405. o. Oxford University Press, 1988. 124 [159] O. Goldreich. Foundations of Cryptography. Cambridge University Press, 2001. 123, 124 [160] O. Goldreich, S. Micali, A. Wigderson. Proofs that yield nothing but their validity or all languages in NP have zero-knowledge proof systems. Journal of the ACM, 38(3):691–729, 1991. 123  [161] S. Goldwasser. Interactive proof systems. In J. Hartmanis (szerkeszto), Computational Complexity Theory, AMS Short Course Lecture Notes: Introductory Survey Lectures. Proceedings of Symposia in Applied Mathematics 38. kötete, 108–128. o. American Mathematical Society, 1989. 124 [162] S. Goldwasser, S. Micali, C. Rackoff. The knowledge complexity of interactive proof systems. SIAM Journal on Computing, 18(1):186–208, 1989. 123, 124 [163] S. Goldwasser, M. Sipser. Private coins versus public coins in interactive proof systems. In S. Micali (szer Randomness and Computation, Advances in Computing Research 5. kötete, 73–90. o. JAI Press, keszto), 1989. A preliminary version appeared in Proc. 18th Ann. ACM Symp. on Theory of Computing, 1986, pp. 59–68. 123 [164] G. Gonnet, D. Gruntz, L. Bernardin Computer algebra systems.

In A. Ralston, E. D. Reilly, D.

 Hemmendinger (szerkesztok), Encyclopedia of Computer Science, 287–301. o. Nature Publishing Group, 4. kiadás, 2000. 93

775

Irodalomjegyzék

[165] O. Gotoh. An improved algorithm for matching biological sequences. Journal of Molecular Biology, 162:705–708, 1982. 575 [166] H. Gouraud. Computer display of curved surfaces. IEEE Transactions on Computers, C-20(6):623–629, 1971. 678 [167] J. Grabowski. On two-machine scheduling with release and due-dates to minimize maximum lateness. Opsearch, 17:133–154, 1980. 414 [168] R. L. Graham. Bounds for certain multiprocessor anomalies. Bell Systems Technical Journal, 45:1563– 1581, 1966. 414 [169] R. L. Graham. Bounds on multiprocessing timing anomalies. SIAM Journal on Applied Mathematics, 17:416–429, 1969. 415 [170] R. L. Graham, E. L. Lawler, J. K. Lenstra, A. H. G. Rinnoy Kan. Optimization and approximation in deterministic sequencing and scheduling: a survey. Annals of Discrete Mathematics, 5:287–326, 1979. 413 [171] R. L. Graham, D. E. Knuth, O. Patashnik. Concrete Mathematics. Addison-Wesley, 1994 (2. kiadás. Magyarul: Konkrét matematika, Muszaki  Könyvkiadó, 1998). 37, 93 [172] A. Grama, A. Gupta, G. Karypis, V. Kumar. Introduction to Parallel Computing. Addison-Wesley, 2003 (2. kiadás). 266 [173] J. Grant, J. Minker. Inferences for numerical dependencies. Theoretical Computer Science, 41:271–287, 1985. 535 [174] J. Grant, J. Minker. Normalization and axiomatization for numerical dependencies. Information and Control, 65:1–17, 1985. 535 [175] D. H. Greene, D. E. Knuth. Mathematics for the Analysis of Algorithms. Birkhäuser, 3. kiadás, 1990. 37 [176] W. Gropp, M. Snir, B. Nitzberg, E. Lusk. MPI: The Complete Reference. Scientic and Engineering Computation Series. The MIT Press, 1998. 267 [177] A. Große, J. Rothe, G. Wechsung. Computing complete graph isomorphisms and hamiltonian cycles from partial ones. Theory of Computing Systems, 35(1):81–93, 2002. 159 [178] A. Grosse, S. Schwarz. Bigblackcell. http://www.minet.uni-jena.de/∼BigBlackCell/. 604 [179] R. Grossman. Symbolic Computation: Applications to Scientic Computing, Frontiers in Applied Mathematics 5. kötete. SIAM, 1989. 93 [180] J. N. D. Gupta, S. S. Reddi. Improved dominance conditions for the three-machine owshop scheduling problem. Operations Research, 26:200–203, 1978. 414 [181] R. Gusella. A measurement study of diskless workstation traffic on an ethernet. IEEE Transactions on Communications, 38:1557–1568, 1990. 221 [182] D. M. Guseld. Algorithms on Strings, Trees and Sequences. Cambridge University Press, 1997. 575, 576 [183] J. Gustafson. Reevaluating Amdahl's law. Communications of ACM, 28(1):532–535, 1988. 267 [184] T. Gyires. Simulation of the harmful consequences of self-similar network traffic. The Journal of Computer Information Systems, 42(4):94–111, 2002. 221 [185] L. Györ. Információ- és kódelmélet (Theory of Information and Coding). Typotex, 2002 (2. kiadás). 455 [186] J. Håstad. Solving simultaneous modular equations of low degree. SIAM Journal on Computing, 17(2):336– 341, 1988. Special issue on cryptography. 123 [187] G. Hadley. Nonlinear and Dynamic Programming. Addison-Wesley, 1964. 360 [188] L. Hageman, D. Young. Applied Iterative Methods. Academic Press, 1981. 765 [189] Gy. F. Hajós. Bevezetés a geometriába (Introduction to Geometry). Tankönyvkiadó, 1972. 683 [190] T. S. Han, K. Kobayashi. Mathematics of Information and Coding. American Mathematical Society, 2002. 455 [191] D. Hankerson, G. A. Harris, P. D. Johnson. Introduction to Information Theory and Data Compression. CRC Press, 2003 (2. kiadás). 455 [192] S. Hannenhalli.

Polynomial-time algorithm for computing translocation distance between genomes.

Discrete Applied Mathematics, 71:137–151, 1996. 578 [193] D. Harper, C. Wooff D. Hodginson. A Guide to Computer Algebra Systems. John Wiley & Sons, 1991. 93 [194] J. Hartmanis, L. Hemachandra. Complexity classes without machines: On complete languages for UP. Theoretical Computer Science, 58(1–3):129–142, 1988. 159 [195] B. Cs. Hatvany. Bitképek feldolgozása Visual Basic programokból (Bitmap Processing by Visual Basic programms). Computer Books, 2003. 716

776

Irodalomjegyzék

[196] V. Havran. Heuristic Ray Shooting Algorithms. PhD thesis, Czech Technical University, 2001. 683, 684 [197] M. Höchsman, T. Töller, R. Giegerich, S. Kurtz. Local similarity in RNA secondary structure. In Proceedings of IEEE Bioinformatics Conference 2003, 159–168. o., 2003. 578 [198] A. C. Hearn. Future Directions for Research in Symbolic Computation. SIAM Reports on Issues in the Mathematical Sciences. SIAM, 1990. 93 [199] H. Hees, D. Lucantoni. A markov modulated characterization of packetized voice and data traffic and related statistical multiplexer performance. IEEE Journal on Selected Areas in Communication, 4:856–868, 1986. 221 [200] E. A. Heinz. Algorithmic Enhancements and Experiments at High Search Depths. Vieweg Verlag, Series on Computational Intelligence, 2000. 604 [201] L. Hemaspaaandra, K. Pasanen, J. Rothe. If P

,

NP then some strongly noninvertible functions are in-

vertible. In Proceedings of the 13th International Symposium on Fundamentals of Computation Theory, Lecture Notes in Computer Science 2138. kötete, 162–171. o. Springer-Verlag, 2001. 123 [202] L. Hemaspaandra, J. Rothe. Creating strong, total, commutative, associative one-way functions from any one-way function in complexity theory. Journal of Computer and Systems Sciences, 58(3):648–659, 1999. 123 [203] L. A. Hemaspaandra, M. Ogihara. The Complexity Theory Companion. EATCS Texts in Theoretical Computer Science. Springer-Verlag, 2002. 158 [204] I. Herman. The Use of Projective Geometry in Computer Graphics. Springer-Verlag, 1991. 683 [205] P. Hermann, A. Iványi. A munkahatékonyság korlátai prexszámításnál és összefésülésnél. Alkalmazott Matematikai Lapok, 2004. Submitted. 267 [206] F. Heylighen. Principia Cybernetica Project. http://pespmc1.vub.ac.be/HEYL.html, 2004. 221 [207] D. S. Hirschberg. A linear space algorithm for computing maximal common subsequences. Communications of the ACM, 18:341–343, 1975. 576  Group-Theoretic Algorithms and Graph Isomorphism, Lecture Notes in Computer [208] C. Hoffman (szerkeszto). Science 136. kötete. Springer-Verlag, 1982. 159 [209] J. E. Hopcroft, R. Motwani, J. D. Ullman. Introduction to Automata Theory, Languages, and Computation. Addison-Wesley, 2. kiadás, 2001. 501 [210] W. A. Horn. Minimizing average ow time with parallel machines. Operations Research, 21:845–847, 1973. 414 [211] E. Horowitz, S. Sahni, S. Rajasekaran. Computer Algorithms. Computer Science Press, 1998. 266 [212] D. A. Huffman. A method for the construction of minimum-redundancy codes. Proceedings of the IRE, 40(9):1098–1101, 1952. 454 [213] R. Hughey, A. Krogh. Hidden markov models for sequence analysis: Extension and analysis of the basic method. CABIOS, 12(2):95–107, 1996. 577 [214] M. Hujter. Egy ütemezéselméleti probléma vizsgálata és alkalmazásai (Investigation of a scheduling problem and its applications), 1987. Doktori értekezés, ELTE TTK. 414 [215] J. Hunt, T. Szymanski. A fast algorithm for computing longest common subsequences. Communications of the ACM, 20(5):350–353, 1977. 576 [216] K. Hwang, Z. Xu. Scalable Parallel Computing. McGraw-Hill, 1998. 267 [217] Interoute. http://wwww.interoute.com/glossary.html, 2004. 221 [218] A. Iványi. On dumpling-eating giants. In Finite and Innite Sets (Eger, 1981), Colloquia of Mathematical Society János Bolyai 37. kötete, 379–390. o. North-Holland, 1984. 502 [219] A. Iványi. Performance bounds for simple bin packing algorithms. Annales Universitatis Scientiarum Budapestinensis de Rolando Eötvös Nominatae, Sectio Computarorica, 5:77–82, 1984. 502 [220] A. Iványi. Tight worst-case bounds for bin packing algorithms. In Theory of Algorithms (Pécs, 1984), Colloquia of Mathematical Society János Bolyai 44. kötete, 233–240. o. North-Holland, 1985. 502 [221] A. Iványi. Párhuzamos algoritmusok (Parallel Algorithms). ELTE Eötvös Kiadó, 2003. 9, 266 [222] A. Iványi, R. Szmeljánszkij. Elements of Theoretical Programming (in Russian). Moszkvai Állami Egyetem, 1985. 502 [223] K. Iwama, S. Tamaki. Improved upper bounds for 3-SAT. Technical Report TR03-053, Electronic Colloquium on Computational Complexity, 2003. 159

Irodalomjegyzék

777

[224] J. R. Jackson. Research Report 43, Management Science Research Project, University of California, 1955. 414 [225] J. R. Jackson. An extension of Johnson's results on job shop scheduling. Naval Research Logistics Quaterly, 3:201–224, 1956. 415 [226] A. Jagota, R. B. Lyngso, C. N. S. Pedersen. Comparing a hidden Markov model and a stochastic contextfree grammar. Lecture Notes in Computer Science 2149. kötete, 69–84. o. Springer-Verlag, 2001. 578 [227] R. Jain, S. Routhier. Packet trains: Measurements and a new model for computer network traffic. IEEE Journal on Selected Areas in Communication, 4:986–995, 1986. 221 [228] J. Jaja. An Introduction to Parallel Algorithms. Addison-Wesley, 1992. 266 [229] M. R. Jerrum. The complexity of nding minimum-length generator sequences. Theoretical Computer Science, 36:265–289, 1986. 578 [230] P. Jiménez, F. Thomas, C. Torras. 3D collision detection: A survey. Computers and Graphics, 25(2):269– 285, 2001. 683 [231] D. Johnson. Near-optimal bin packing algorithms, 1973. PhD értekezés. 502 [232] S. M. Johnson. Optimal two- and three-stage production schedules with setup times included. Naval Research Logistics Quaterly, 1:61–68, 1954. 415 [233] D. S. Johnson, A. Demers, J. D. Ullman, M. R. Garey, R. L. Graham. Worst-case performance-bounds for simple one-dimensional bin packing algorithms. SIAM Journal on Computing, 3:299–325, 1974. 502 [234] G. A. Jones, J. Jones. Information and Coding Theory. Springer-Verlag, 2000. 221 [235] K. Jones. Consultant's Guide to COMNET III. CACI Product Company, 1997. 221 [236] S. Kakutani. A generalization of Brouwer's xed point theorem. Duke Mathematical Journal, 8:457–459, 1941. 359 [237] M. Kandemir, J. Ramanujam, A. Choudhary. Compiler algorithms for optimizing locality and parallelism on shared and distributed-memory machines. Journal of Parallel and Distributed Computing, 60:924–965, 2000. 267 [238] S. Karamardian. The nonlinear complementarity problems with applications. I, II. Journal of Optimization Theory and Applications, 4:87–98 and 167–181, 1969. 360  [239] Z. Karian, A. Starrett. Use of symbolic computation in probability and statistics. In Z. Karian (szerkeszto), Symbolic Computation in Undergraduate Mathematics Education, number24 in Notes of Mathematical Association of America. Mathematical Association of America, 1992. 93 [240] S. Karlin, M. T. Taylor. A First Course in Stochastic Processes. Academic Press, 1975. 684  [241] R. M. Karp. Reducibility among combinatorial problems. In R. E. Miller, J. W. Thatcher (szerkesztok), Complexity of Computer Computations, 85–103. o. Plenum Press, 1972. 158 [242] R. M. Karp, R. E. Miller, S. Winograd. The organization of computations for uniform recurrence equations. Journal of the ACM, 14:563–590, 1967. 310 [243] Z. Kása. Combinatorica cu aplica¸tii (Combinatorics with Applications). Presa Universitar a Clujean a, 2003. 37 [244] I. Kátai. Szimuláció (Simulation). Tankönyvkiadó, 1981. 221 [245] J. Köbler, U. Schöning, S. Toda, J. Torán. Turing machines with few accepting computations and low sets for PP. Journal of Computer and System Sciences, 44(2):272–286, 1992. 159 [246] J. Köbler, U. Schöning, J. Torán. Graph isomorphism is low for PP. Computational Complexity, 2:301–330, 1992. 123, 159 [247] J. Köbler, U. Schöning, J. Torán. The Graph Isomorphism Problem: Its Structural Complexity. Birkhäuser, 1993. 124, 159 [248] A. Kóczy, K. Kondorosi. Operációs rendszerek – mérnöki megközelítésben (magyarul: Operating Systems - An Engineering Approach). Panem, 1999. 502 [249] J. Ködmön. Kriptográa: Az informatikai biztonság alapjai, a Pgp kriptorendszer használata (Cryptography: Bases of the Security of Computer Systems. Use of Cryptosystem Pgp). Computerbooks, 2002. 124 [250] J. Kececioglu, H. Lenhof, K. Mehlhorn, P. Mutzel, K. Reinert, M. Vingron. A polyhedral approach to sequence alignment problems. Discrete Applied Mathematics, 104((1-3)):143–186, 2000. 576 [251] K. Kennedy, R. Allen. Optimizing Compilers for Modern Architectures. Morgan Kaufman Publishers, 2001. 267

778

Irodalomjegyzék

[252] B. Kernighan, R. Pike. The UNIX programming Environment. Prentice Hall, 1984 (Magyarul: A UNIX operációs rendszer., Muszaki  Könyvkiadó, 1987 és 1999). 502 [253] A. Kertész. A térinformatika és alkalmazásai (Geoinformatics and it Applications). Holnap Kiadó, 1997. 716  [254] B. Kiss, A. Krebsz. Játékelmélet (Game Theory). Széchenyi István Foiskola, 1999. 360 [255] S. Kleiman, D. Shah, B. Smaalders. Programming with Threads. Prentice Hall, 1996. 267 [256] L. Kleinrock. Queueing Systems. John Wiley & Sons, 1975 (Magyarul: Sorbanállás – kiszolgálás: Bevezetés a tömegkiszolgálási rendszerek elméletébe, http://www.muszakikiado.hu/kezdolap.php Könyvkiadó, 1979). 221 [257] B. Knudsen, J. Hein. Pfold: RNA secondary structure prediction using stochastic context-free grammars. Nucleic Acids Researchs, 31(13):3423–3428, 2003. 577 [258] D. E. Knuth. Fundamental Algorithms, The Art of Computer Programming 1. kötete. Addison-Wesley, 1968 (3., javított kiadás 1997. Magyarul: A számítógép-programozás muvészete.  1. kötet. Alapveto  algoritmusok, Muszaki  Könyvkiadó, 1993, 2. kiadás.). 9, 37, 93 [259] D. E. Knuth. Seminumerical Algorithms, The Art of Computer Programming 2. kötete. Addison-Wesley, 1969 (3. javított kiadás 1998. Magyarul: A számítógép-programozás muvészete.  2. kötet. Szeminumerikus algoritmusok, Muszaki  Könyvkiadó, 1993, 2. kiadás.). 9, 93 [260] D. E. Knuth. Sorting and Searching, The Art of Computer Programming 3. kötete. Addison-Wesley, 1973 (3., javított kiadás 1997. Magyarul: A számítógép-programozás muvészete.  3. kötet. Keresés és rendezés, Muszaki  Könyvkiadó, 1994, 2. kiadás.). 9, 93 [261] D. E. Knuth, J. H. Morris Jr., V. R. Pratt. Fast pattern matching in strings. SIAM Journal on Computing, 6(2):323–350, 1977. 576 [262] C. H. Koelbel, D. B. Loveman, R. S. Schreiber, G. Steele Jr., M. E. Zosel. The High Performance Fortran Handbook. The MIT Press, 1994. 267 [263] A. Kovács. Komputer algebra a tudományokban és a gyakorlatban (Computer algebra in science and practice). Alkalmazott Matematikai Lapok, 18:181–202, 1994-98. 93 [264] A. Kovács. Computer algebra: Impact and perspectives. Nieuw Archief voor Wiskunde, 17(1):29–55, 1999. 93 [265] M. Kovács. Nemlineáris programozás (Nonlinear Programming). Typotex, 1997. 360 [266] G. Krammer. Notes on the mathematics of the PHIGS output pipeline. Computer Graphics Forum, 8(8):219–226, 1989. 683  [267] H. W. Kuhn, A. Tucker (szerkesztok). Contributions to the Theory of Games. II. Princeton University Press, 1953. 359  [268] H. T. Kung, C. E. Leiserson. Systolic arrays (for VLSI). In I. S. Duff, G. W. (szerkesztok), Sparse Matrix Proceedings, 256–282. o. SIAM, 1978. 310 [269] S. Kurtz, B. Balkenhol. Space efficient linear time computation of the Burrows and Wheeler transformation.  In I. Althöfer, N. Cai, L. Dueck, M. Khachatrian, A. Pinsker, I. Sarközy, I. Wegener, Z. Zhang (szerkesztok), Numbers, Information and Complexity, 375–383. o. Kluwer Academic Publishers, 2000. 454 [270] R. Ladner. On the structure of polynomial time reducibility. Journal of the ACM, 22(1):155–171, 1975. 159 [271] R. Ladner, N. Lynch, A. Selman. A comparison of polynomial time reducibilities. Theoretical Computer Science, 1(2):103–124, 1975. 158 [272] B. Lageweg, J. K. Lenstra, A. Rinnoy Kan. Job-shop scheduling by implicit enumeration. Management Science, 24:441–450, 1977. 414, 415 [273] B. Lageweg, J. K. Lenstra, A. Rinnoy Kan. A general bounding scheme for the permutation ow-shop problem. Operations Research, 26:53–67, 1978. 414 [274] T. Lai, S. Sahni. Anomalies in parallel branch and bound algorithms. Communications of ACM, 27(6):594– 602, 1984. 502 [275] J. Lamperti. Stochastic Processes. Springer-Verlag, 1972. 684 [276] G. Lancia. Integer programming models for computational biology problems. Journal of Computer Science and Technology, 19(1):60–77, 2004. 576 [277] G. Landau, U. Vishkin. Ecient string matching with k mismatches. Theoretical Computer Science, 43:239– 249, 1986. 576 [278] G. Langdon. An introduction to arithmetic coding. IBM Journal of Research and Development, 28:135– 149, 1984. 454 [279] R. Laurini, D. Thompson. Fundamentals of Spatial Information Systems. Academic Press, 1992. 716

779

Irodalomjegyzék

[280] A. Law, W. Kelton. Simulation Modeling and Analysis. McGraw-Hill Higher Education, 3. kiadás, 1999. 221 [281] E. L. Lawler. Optimal sequencing of a single machine subject to precedence constraints. Management Science, 19:544–546, 1973. 414 [282] E. L. Lawler, J. K. Lenstra, A. H. G. Rinnoy Kan, D. B. Shmoys. Sequencing and scheduling: Algorithms  and complexity. In S. C. Graves, A. Kan, P. Zipkin, P. H.szerkesztok), Handbooks in Operations Research and Management Science, Volume 4: Logistics of Production and Inventory, 445–522. o. Elsevier, 1993. 413, 414 [283] F. T. Leighton. Introduction to Parallel Algorithms and Architectures: Arrays-Trees-Hypercubes. Morgan Kaufman Publishers, 1992. 266 [284] F. T. Leighton. Introduction to Parallel Algorithms and Architectures: Algorithms and VSLI. Morgan Kaufman Publishers, 2001. 266 [285] W. Leland, M. Taqqu, W. Willinger, D. Wilson. On the self-similar nature of ethernet traffic (extended version). IEEE/ACM Transactions on Networking, 2(1), 1994. 221 [286] W. Leland, M. Taqqu, W. Willinger, D. Wilson. Statistical analysis and stochastic modeling of self-similar  The Fundamental Role of Teletraffic in the Evoludata-traffic. In J. Labetoulle, J. W. Roberts (szerkesztok), tion of Telecommunications Networks. Elsevier Science B. V., 1994. 221 [287] W. Leland, M. Taqqu, D. Wilson. On the self-similar nature of ethernet traffic. Computer Communication Reviews, 23, 1993. 221 [288] A. Lenstra, H. Lenstra. The Development of the Number Field Sieve, Lecture Notes in Mathematics 1554. kötete. Springer-Verlag, 1993. 123 [289] C. Leopold. Parallel and Distributed Computing. John Wiley & Sons, Copyrights 2001. 266, 267 [290] B. Lewis, D. J. Berg. Multithreaded Programming with Phtreads. Prentice Hall, 1998. 267 [291] T. Linder, G. Lugosi. Bevezetés Tankönyvkiadó, 1990. 455

az

információelméletbe

(Introduction

to

Information

Theory).

[292] M. Listanti, V. Eramo, R. Sabella. Architectural and technological issues for future optical internet networks. IEEE Communications Magazine, (9):82–92, 2000. 221  [293] A. Álmos, S. Gyori, G. Horváth, A. Várkonyiné Kóczy. Genetikus algoritmusok (Genetic Algorithms). Typotex, 2002. 604 [294] P. Longley, D. Maguire, M. Goodschild, D. Rhind. Geographic Information Systems and Science. John Wiley & Sons, 2001. 716 [295] L. Lovász, P. Gács. Algoritmusok (Algorithms). Muszaki  Könyvkiadó és Tankönyvkiadó, 1978 és 1987. 9 [296] L. Lovász. Combinatorial Problems and Exercises. Akadémiai Kiadó, 1979 (Magyarul: Kombinatorikai problémák és feladatok, Typotex, 1999). 37 [297] L. Lovász. Algoritmusok bonyolultsága (Complexity of Algorithms). ELTE TTK, 1990. 159 [298] C. Lucchesi. Candidate keys for relations. Journal of of Computer and System Sciences, 17(2):270–279, 1978. 534 [299] G. Lunter, I. Miklós, A. Drummond, J. L. Jensen, J. Hein. Bayesian phylogenetic inference under a statistical indel model. Lecture Notes in Bioinformatics, 2812:228–244, 2003. 577 [300] G. Lunter, I. Miklós, Y., J. Hein. An efficient algorithm for statistical multiple alignment on arbitrary phylogenetic trees. Journal of Comp. Biology, 10(6):869–889, 2003. 577 [301] N. A. Lynch. Distributed Algorithms. Morgan Kaufman Publisher, 2001 (Ötödik kiadás. Magyarul: Osztott algoritmusok. Kiskapu Kiadó, 2002). 9, 311 [302] R. Lyngso, C. N. S. Pedersen. RNA pseudoknot prediction in energy based models. Journal of Comp. Biology, 7(3/4):409–428, 2000. 578

[303] R. Lyngso, M. Zuker, C. Pedersen. Fast evaluation of internal loops in RNA secondary structure prediction. Bioinformatics, 15(6):440–445, 1999. 578 [304] D. J. Maguire, M. Goodschild, D. Rhind. Geographical Information Systems. Longman, 1991. 716 [305] D. Maier. Minimum covers in the relational database model. Journal of the ACM, 27(4):664–674, 1980. 534 [306] D. Maier, A. O. Mendelzon, Y. Sagiv. Testing implications of data dependencies. ACM Transactions on Database Systems, 4(4):455–469, 1979. 534 [307] B. Mandelbrot. The Fractal Geometry of Nature. W. H. Freeman, 1982. 221

780

Irodalomjegyzék

[308] B. Mandelbrot, J. W. Van Ness. Fractional brownian motions, fractional noises and applications. SIAM Review, 10:422–437, 1968. 221 [309] O. Mangasarian, H. Stone. Two-person zero-sum games and quadratic programming. Journal of Mathematical Analysis and its Applications, 9:348–355, 1964. 360 [310] A. S. Manne. On the job-shop scheduling problem. Operations Research, 9:219–223, 1960. 414 [311] B. Martos. Nonlinear Programming Theory and Methods. Akadémiai Kiadó, 1975. 360 [312] R. Mathon. A note on the graph isomorphism counting problem. Information Processing Letters, 8(3):131– 132, 1979. 159 [313] R. L. Mattson, J. Gecsei, D. R. Slutz, I. Traiger. Evaluation techniques for storage hierarchies. IBM Systems Journal, 9(2):78–117, 1970. 501 [314] E. A. Maxwell. Methods of Plane Projective Geometry Based on the Use of General Homogenous Coordinates. Cambridge University Press, 1946. 683 [315] E. A. Maxwell. General Homogenous Coordinates in Space of Three Dimensions. Cambridge University Press, 1951. 683 [316] McAfee. Sniffer technologies. http://www.nai.com/us/index.asp, 2004. 221 [317] J. S. McCaskill. The equilibrium partition function and base pair binding probabilities for RNA secondary structure. Biopolymers, 29:1105–1119, 1990. 578 [318] G. B. McMahon. Optimal production schedules for ow shops. Canadian Operation Research Society Journal, 7:141–151, 1969. 414 [319] R. McNaughton. Scheduling with deadlines loss functions. Management Science, 6:1–12, 1959. 414 [320] B. Melamed. An overview of tes processes and modeling methodology. In L. Donatiello, A. R. Nelson (szer kesztok), Models and Techniques for Performance Evaluation of Computer and Communications Systems, Lecture Notes in Computer Science, 359–393. o. Springer-Verlag, 1993. 221 [321] A. Meskó. A digitális szeizmikus feldolgozás alapjai (Introduction to Processing of Digital Seismic Data). Tankönyvkiadó, 1978. 716 [322] A. Meskó. Geozikai adatfeldolgozás (Processing of Geophysical Data). Tankönyvkiadó, 1983. 716 [323] A. Meyer, L. Stockmeyer. The equivalence problem for regular expressions with squaring requires exponential space. In Proceedings of the 13th IEEE Symposium on Switching and Automata Theory, 125–129. o., 1972. 159 [324] I. Meyer, R. Durbin. Comparative ab initio prediction of gene structures using pair HMMs. Bioinformatics, 18(10):1309–1318, 2002. 576, 577 [325] I. M. Meyer, R. Durbin. Gene structure conservation aids similarity based gene prediction. Nucleic Acids Research, 32(2):776–783, 2004. 577 [326] D. Micciancio, S. Goldwasser. Complexity of Lattice Problems: A Cryptographic Perspective, The Kluwer International Series in Engineering and Computer Science 671. kötete. Kluwer Academic Publishers, 2002. 123 [327] R. E. Mickens. Difference Equations. Theory and Applications. Van Nostrand Reinhold, 1990. 37 [328] M. E. Mignotte. Mathematics for Computer Algebra. Springer, 1992. 93 [329] Sz. Mihnovszkij, N. Shor. Estimation of the page fault number in paged memory (in russian). Kibernetika (Kiev), 1(5):18–20, 1965. 501 [330] G. L. Miller. Riemann's hypothesis and tests for primality. Journal of Computer and Systems Sciences, 13(3):300–317, 1976. 123 [331] W. Miller, E. Myers. A le comparison program. Software – Practice and Experience, 15(11):1025–1040, 1985. 576 [332] W. Miller, E. W. Myers. Sequence comparison with concave weighting functions. Bulletin of Mathematical Biology, 50:97–120, 1988. 575 [333] H. Mills. Equilibrium points of nite games. SIAM Journal of Applied Mathematics, 8:397–402, 1976. 360 [334] B. E. Mishra. Algorithmic Algebra. Springer, 1993. 93 [335] S. Molnár, A. Vidács, A. Nilsson. Bottlenecks on the way towards characterization of network traffic: Es-

timation and interpretation of the hurst parameter. http://hsnlab.ttt.bme.hu/ molnar (Conference papers), 1997. 221

[336] B. Monien, E. Speckenmeyer. Solving satisability in less than 2 10:287–295, 1985. 158, 159

n

steps. Discrete Applied Mathematics,

Irodalomjegyzék

781

[337] B. Morgenstern. DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment. Bioinformatics, 15:211–218, 1999. 577 [338] B. Márkus. Térinformatika Magyarországon'94. Technológia Transzfer Centrum, 1994. 716  algoritmusok átlagos bonyolultságának vizsgálata, 1995. Kandidátusi értekezés. [339] G. Márton. Sugárköveto 683 [340] M. Márton, J. Paksi, B. Márkus. Térinformatikai alapismeretek (Elements of Geoinformatics). Technológia Transzfer Centrum, 1994. 716 [341] J. Mészáros. Játékelmélet (Game Theory). Gondolat Kiadó, 2004. 360 [342] J. Nash. Noncooperative games. Annals of Mathematics, 54:286–295, 1951. 359 [343] M. Nebel. Identifying good predictions of rna secondary structure. In R. B. Altman, A. K. Dunker, L. Hun ter, T. E. Klein (szerkesztok), Pacic Symposium on Biocomputing, 9. kötet, 423–434. o. PSB Online, http://psb.stanford.edu/psb-online/, 2004. 578

[344] S. N. Needleman, C. Wunsch. A general method applicable to the search for similarities in the amino acid sequence of two proteins. Journal of Molecular Biology, 48:443–453, 1970. 575 [345] M. Nelson, J. L. Gailly. The Data Compression Book. M&T Books, 1996. 455 [346] J. Neumann, O. Morgenstern. Theory of Games and Economical Behaviour. Princeton University Press, 1947 (2. kiadás). 360 [347] M. F. Neuts. A versatile markovian point process. Journal of Applied Probability, 18:764–779, 1979. 221 [348] M. F. Neuts. Structured Stochastic Matrices of M/G/1 Type and Their Applications. Marcel Dekker, 1989. 221 [349] M. E. Newell, R. G. Newell, T. L. Sancha. A new approach to the shaded picture problem. In Proceedings of the ACM National Conference, 443–450. o., 1972. 684 [350] H. Nikaido, K. Isoda. Note on noncooperative games. Pacic Journal of Mathematics, 5:807–815, 1955. 360 [351] S. Oaks, H. Wong. Java Threads. O'Reilly, 1999. 267 [352] A. Odlyzko. Applications of Symbolic Mathematics to Mathematics. Kluwer Academic Publishers, 1985. 93 [353] K. Okuguchi. Expectation and Stability of Oligopoly Models. Springer, 1976. 360 [354] K. Okuguchi, F. Szidarovszky. The Theory of Oligopoly with Multi-Product Firms. Springer, 1999 (2. kiadás). 360 [355] OpenMP Website. http://www.openmp.org, 2004. 267 [356] OPNET. Opnet Modeler Documentation. www.opnet.com, 2004. 221 [357] J. O'Rourke. Art Gallery Theorems and Algorithms. Oxford University Press, 1987. 683 [358] C. H. Papadimitriou. Computational Complexity. Addison-Wesley, 1994 (Magyarul: Kiszámítási bonyolultság, Novadat, 1999). 124, 158, 159 [359] C. Partridge. The end of simple traffic models. IEEE Network, (9), 1993. Editor's Note. 221 [360] R. Pasco. Source Coding Algorithms for Fast Data Compression. PhD thesis, Stanford University, 1976. 454 [361] R. Paturi, P. Pudlák, M. Saks, F. Zane. An improved exponential-time algorithm for k-SAT. In Proceedings of the 39th IEEE Symposium on Foundations of Computer Science, 628–637. o. IEEE Computer Society Press, 1998. 159 [362] R. Pavelle, M. Rothstein. Computer algebra. Scientic American, 245(12):102–113, 1981. 93 [363] V. Paxson, S. Floyd. Wide-area traffic: The failure of Poisson modelling. IEEE/ACM Transactions on Networking, 3(3):226–244, 1995. 221 [364] J. S. Pedersen J. Hein. Gene nding with a hidden Markov model of genome structure and evolution. Bioinformatics, 19(2):219–227, 2003. 577 [365] I. Peák. Bevezetés az automaták elméletébe. Az automaták mint információátalakító rendszerek 1. (Introduction to the Theory of Automata. Automata an Systems for the Transformation of the Information). Tankönyvkiadó, 1977. 501 [366] G. Perlman. HCI bibliography, 2004. 604 [367] S. Petrov. Finite axiomatization of languages for representation of system properties. Information Sciences, 47:339–372, 1989. 534 [368] P. A. Pevzner. Computational Molecular Biology: An Algorithmic Approach. The MIT Press, 2000. 576

782

Irodalomjegyzék

[369] G. F. Pster. In Search of Clusters. Prentice Hall, 1998 (2. kiadás). 267 [370] J. Piehler. Ein Beitrag zum Reihenfolgeproblem, Unternehmensforschung. Unternehmerforschung, 4:138– 142, 1960. 414 [371] M. Pinedo. Scheduling: Theory, Algorithms and Systems. Pearson Education, 2001 (2. kiadás). 415  [372] M. Pinedo. Planning and Scheduling in Manufacturing and Services. Springer-Verlag, 2004 (megjelenoben). 415 [373] N. Pisanti, M. Sagot. Further thoughts on the syntenic distance between genomes. Algorithmica, 34(2):157– 180, 2002. 578 [374] J. Podani. Bevezetés a többváltozós biológiai adatfeltárás rejtelmeibe. Scientia, 1997. 576, 604 [375] J. M. Pollard. Theorems on factorization and primality testing. Proceedings of the Cambridge Philosophical Society, 76:521–528, 1974. 123 [376] F. P. Preparata, M. I. Shamos. Computational Geometry: An Introduction. Springer-Verlag, 1985. 683 [377] A. Prékopa. Valószínuségelmélet  muszaki  alkalmazásokkal. Muszaki  Könyvkiadó, 1962. 221 [378] T. Pupko, I. Peer, R. Shamir, D. Graur. A fast algorithm for joint reconstruction of ancestral amino acid sequences. Molecular Biology and Evolution, 17:890–896, 2000. 577 [379] P. Quinton. Automatic synthesis of systolic arrays from uniform recurrent equations. In Proceedings of the 11th Annual International Symposium on Computer Architecture, 208–214. o., 1984. 310 [380] M. Rabi, A. Sherman. An observation on associative one-way functions in complexity theory. Information Processing Letters, 64(5):239–244, 1997. 123 [381] M. O. Rabin. Probabilistic algorithms for testing primality. Journal of Number Theory, 12(1):128–138, 1980. 123 [382] R. Rao, J. Rothe, O. Watanabe. Upward separation for FewP and related classes. Information Processing Letters, 52(4):175–180, 1994 (Corrigendum appears in the same journal,74(1–2):89, 2000). 159 [383] S. K. Rao. Regular iterative algorithms and their implementations on processor arrays. Doktori értekezés, Stanford University, 1985. 310 [384] P. Resnick, H. R. Varian. Recommender Systems. Communications of the ACM, 40(3):56–58, 1997. 604 [385] J. Richards. Remote Sensing Digital Image Analysis. Springer-Verlag, Australia, 1986. 716 [386] P. Rigaux, M. Scholl, A. Voisard. Spatial Databases with Application to GIS. Morgan Kaufman Publisher, 2001. 716 [387] J. Rissanen, G. Arithmetic coding. IBM Journal of Research and Development, 23:149–162, 1979. 454 [388] J. J. Rissanen. Generalized Kraft inequality and arithmetic coding. IBM Journal of Research and Development, 20:198–203, 1976. 454 [389] J. Ritt. Integration in Finite Terms. Columbia University Press, 1948. 92 [390] E. Rivas, S. Eddy. A dynamic programming algorithm for RNA structure prediction including pseudoknots. Journal of Molecular Biology, 285(5):2053–2068, 1999. 578 [391] R. L. Rivest, A. Shamir, L. M. Adleman. A method for obtaining digital signatures and public-key cryptosystems. Communications of the ACM, 21(2):120–126, 1978. Lásd még az U.S. Patent 4 405 829 számú szabadalmat. 123 [392] L. Rónyai, G. Ivanyos, R. Szabó. Algoritmusok (Algorithms). Typotex, 1999. 9, 159 [393] A. Rényi. Probability Theory. Akadémiai Kiadó/North Holland Publ. House, 1970 (Magyarul: Valószínu ségelmélet, Tankönyvkiadó, Budapest, 1973). 221 [394] J. Robinson. An iterative method of solving a game. Annals of Mathematics, 154:296–301, 1951. 360 [395] D. F. Rogers, J. Adams. Mathematical Elements for Computer Graphics. McGraw-Hill, 1989. 683 [396] S. H. Roosta. Parallel Processing and Parallel Algorithms. Springer-Verlag, 1999. 266, 502 [397] J. Rosen. Existence and uniqueness of equilibrium points for concave n-person games. Econometrica, 33:520–534, 1965. 360 [398] J. Rothe. Some facets of complexity theory and cryptography: A ve-lecture tutorial. ACM Computing Surveys, 34(4):504–549, 2002. 123, 124 [399] J. Rothe. A promise class at least as hard as the polynomial hierarchy. Journal of Computing and Information, 1(1):92–107, 1995. 159 [400] J. Rothe. Complexity Theory and Cryptology. An Introduction to Cryptocomplexity. EATCS Texts in Theoretical Computer Science. Springer-Verlag, 2005. 158, 159

783

Irodalomjegyzék

[401] M. H. Rothkopf. Scheduling independent tasks on parallel machines. Management Science, 12:437–447, 1966. 414 [402] R. O. Roundy, W. L. Maxwell, Y. T. Herer, S. R. Tayur, A. W. Getzler. A price-directed approach of production operations. IIE Transactions, 23:149–160, 1991. 415 [403] B. Roy, B. Sussmann. Les problémes d'ordonnuncement avec contraintes disjonctives. Note DS no. 9 bis, SEMA, 1964. 414 [404] S. Sahni. Algorithms for scheduling independent tasks. Journal of the ACM, 23:116–127, 1976. 414 [405] S. Sahni. Preemptive scheduling with due dates. Operations Research, 27:929–934, 1979. 414 [406] A. Sali, Sr., A. Sali. Generalized dependencies in relational databases. Acta Cybernetica, 13:431–438, 1998. 535 [407] A. Salomaa. Public-Key Cryptography, EATCS Monographs on Theoretical Computer Science 23. kötete. Springer-Verlag, 2. kiadás, 1996. 122, 123 [408] D. Salomon. Data Compression. Springer-Verlag, 2004 (3. kiadás). 455 [409] J.

Sameith.

On

the

generation

of

alternative

solutions

for

discrete

problems with uncertain data – an experimental analysis of the http://www.minet.uni-jena.de/Math-Net/reports/shadows/04-01report.html, 2004. 604

optimization

penalty

method.

[410] H. Samet. The quadtree and related hierarchical data structures. ACM Computer Surveys, 16(2):187–260, 1984. 716 [411] D. Sankoff. Minimal mutation trees of sequences. SIAM Journal of Appliedl Mathematics, 28:35–42, 1975. 575 [412] L. A. Santaló. Integral Geometry and Geometric Probability. Addison-Wesley, 1976. 684 [413] K. Sayood. Introduction to Data Compression. Morgan Kaufman Publisher, 2000 (2. kiadás). 455 [414] U. Schöning. A low and a high hierarchy within NP. Journal of Computer and System Sciences, 27:14–28, 1983. 159 [415] U. Schöning. Graph isomorphism is in the low hierarchy. Journal of Computer and System Sciences, 37:312–323, 1987. 159 [416] U. Schöning. A probabilistic algorithm for k-SAT based on limited local search and restart. In Proceedings of the 40th IEEE Symposium on Foundations of Computer Science, 410–414. o. IEEE Computer Society Press, 1999. 158, 159 [417] U. Schöning. Algorithmik. Spektrum Akademischer Verlag, 2001. 160 [418] U. Schöning. Ideen der Informatik. Oldenbourg Verlag, 2002. 158 [419] L. Schrage. Solving resource-constrained network problems by implicit enumeration. Operations Research, 18:263–278, 1970. 414 [420] L. Schrage. Obtaining optimal solutions to resource constrained network scheduling problems, 1971. Publikálatlan kézirat. 414 [421] R. Sedgewick, P. Flajolet. An Introduction to the Analysis of Algorithms. Addison-Wesley, 1996. 37 [422] R. Seidel. A simple and fast incremental randomized algorithm for computing trapezoidal decompositions and for triangulating polygons. Computational Geometry: Theory and Applications, 1(1):51–64, 1991. 683 [423] A. Selman. Polynomial time enumeration reducibility. SIAM Journal on Computing, 7(4):440–457, 1978. 158 [424] C. Semple, M. Steel. Phylogenetics. Number24 in Oxford Lecture Series in Mathematics and Its Applications. Oxford Press, 2003. 576 [425] A. Shamir. IP

= PSPACE.

Journal of the ACM, 39(4):869–877, 1992. 123

[426] C. Shannon. Communication theory of secrecy systems. Bell System Technical Journal, 28(4):657–715, 1949. 123 [427] H. N. Shapiro. Note on a computation method in the theory of games. Communications on Pure and Applied Mathematics, 11:587–593, 1958. 360 [428] B. Sharp. Implementing subdivision theory. Game Developer, 7(2):40–45, 2000. 683 [429] B. Sharp. Subdivision Surface theory. Game Developer, 7(1):34–42, 2000. 683 [430] I. Shindyalov, P. Bourne. Protein structure alignment by incremental combinatorial extension (CE) of the optimal path. Protein Engineering, 11(9):739–747, 1998. 577 [431] A. Silberschatz, P. Galvin, G. Gagne. Applied Operating System Concepts. John Wiley & Sons, 2000. 501

784

Irodalomjegyzék

[432] D. Sima, T. Fountain, P. Kacsuk. Advanced Computer Architectures: a Design Space Approach. AddisonWesley Publishing Company, 1998 (2. kiadás. Magyarul: Korszeru  számítógéparchitektúrák tervezésitérmegközelítésben. Szak Kiadó, 1998). 221, 266, 311 [433] S. Singh. The Code Book. The Secret History of Codes and Code Breaking. Fourth Estate, 1999 (Magyarul: Kódkönyv. A rejtjelezés és rejtjelfejtés története. Park Könyvkiadó, 2002). 123, 124 [434] W. Smith. Various optimizers for single-stage production. Naval Research Logistics Quaterly, 3:59–66, 1956. 414, 415 [435] M. Snir, S. W. Otto, S. D. W. Huss-Lederman, D. W. Walker, J. Dongarra. MPI: The Complete Reference. The MIT Press, 1996. 267 [436] R. Solovay, V. Strassen. A fast Monte Carlo test for primality. SIAM Journal on Computing, 6:84–85, 1977. Erratum appears in the same journal, 7(1):118, 1978. 123 [437] G. Stephen. String searching algorithms, Lecture Notes Series on Computing 3. kötete. World Scientic, Singapore, 1994. 576 [438] R. Stephens. Visual Basic Graphics Programming. John Wiley & Sons, 2000. 716 [439] D. Stinson. Cryptography: Theory and Practice. CRC Press, 2002 (2. kiadás). 123 [440] L. Stockmeyer. The polynomial-time hierarchy. Theoretical Computer Science, 3(1):1–22, 1977. 159  [441] G. Stoyan (szerkeszto). MATLAB 4. és 5. verzió. Typotex, 1999. 765 [442] I. Sutherland, G. Hodgeman. Reentrant polygon clipping. Communications of the ACM, 17(1):32–42, 1974. 683 [443] I. E. Sutherland, R. Sproull, R. Schumacker. A characterization of ten hidden-surface algorithms. Computing Surveys, 6(1):1–55, 1974. 684  Graphics Programming Methods. [444] L. Szécsi. An effective kd-tree implementation. In J. Lander (szerkeszto), Charles River Media, 2003. 684 [445] F. Szidarovszky, C. Chiarella. Dynamic oligopolies, stability and bifurcation. Cubo Mathemática Educational, 3(2):267–284, 2001. 360 [446] F. Szidarovszky, S. Molnár. Játékelmélet muszaki  alkalmazásokkal: Többcélú programozás, klasszikus és differenciáljátékok (Game Theory with Technical Applications: Programming with Multiple Aims, Classical  Könyvkiadó, 1986. 360 and Differential Games). Muszaki

[447] F. Szidarovszky, S. Yakowitz. Principles and Procedures of Numerical Analysis. Plenum Press, 1998. 360 [448] L. Szirmay-Kalos. Számítógépes graka (Computer Graphics). ComputerBooks, 1999. 684  Theory of Three Dimensional Computer Graphics. Akadémiai Kiadó, 1995. [449] L. Szirmay-Kalos (szerkeszto). 684 [450] L. Szirmay-Kalos, Gy. Antal, F. Csonka. Háromdimenziós graka, animáció és játékfejlesztés

+ CD (Three

Dimensional Graphics, Animation and Game Development). Computerbooks, 2003. 683, 684 [451] L. Szirmay-Kalos, G. Márton. Worst-case versus average-case complexity of ray-shooting. Computing, 61(2):103–131, 1998. 683 [452] J. Sztrik. Bevezetés a sorbanállási elméletbe és alkalmazásaiba. http://irh.inf.unideb.hu/user/jsztrik/, 2004. 221 [453] W. Szwarc. Optimal elimination methods in the m × n sequencing problem. Operations Research, 21:1250– 1259, 1973. 414 [454] W. Szwarc. Dominance conditions for the three-machine ow-shop problem. Operations Research, 26:203– 206, 1978. 414 [455] W. Szwarc. Elimination methods in the m × n sequencing problem. CWI Quarterly, 18:295–305, 1971. 414 [456] A. S. Tanenbaum. Modern Operating Systems. Prentice Hall, 2001. 267 [457] A. S. Tanenbaum. Computer Networks. Prentice Hall, 2004 (4. kiadás. Magyarul: Számítógép-hálózatok. Panem, 2004). 221 [458] A. S. Tanenbaum, M. van Steen. Distributed systems. Principles and Paradigms. Prentice Hall, 2002 (Magyarul: Elosztott rendszerek. Panem, 1999). 267 [459] A. S. Tanenbaum, A. Woodhull. Operating Systems. Design and Implementation. Prentice Hall, 1997 (Magyarul: Operációs rendszerek. Panem, 1999). 501, 502 [460] M. Taqqu, W. Teverovsky, W. Willinger. Estimators for long-range dependence: an empirical study. Fractals, 3(4):785–788, 1995. 221

Irodalomjegyzék

785

[461] A. Tarski. A lattice-theoretical xpoint theorem and its application. Pacic Journal of Mathematics, 5:285– 308, 1955. 359 [462] D. S. Taubman, M. W. Marcelin. JPEG 2000 – Image Compression, Fundamentals, Standards and Practice. Society for Industrial and Applied Mathematics, 1983. 455 [463] J. Teich, L. Thiele. Control generation in the design of processor arrays. International Journal of VLSI and Signal Processing, 3(2):77–92, 1991. 310 [464] B. Thalheim. Dependencies in Relational Databases. Teubner Verlagsgesellschaft, 1991. 535 [465] J. D. Thompson, D. G. Higgins, T. J. Gibson. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specic penalties and weight matrix choice. Nucleic Acids Research, 22:4673–4680, 1994. 575 [466] I. Tinoco, O., Uhlenbeck M. Levine. Estimation of secondary structure in ribonucleic acids. Nature, 230:362–367, 1971. 577 [467] Top 500 Supercomputer Sites. http://www.top500.org, 2004. 266 [468] Trusoft Intl Inc.. Benoit 1.1. Trusoft Intl Inc., 2004. 221 [469] D. M. Tsou, P. C. Fischer. Decomposition of a relation scheme into Boyce–Codd normal form. SIGACT News, 14(3):23–29, 1982. 534 [470] A. Turing. On computable numbers, with an application to the Entscheidungsproblem. Proceedings of the London Mathematical Society, ser. 2, 2:230–265, 1936 (Correction, ibid, vol. 43, pp. 544–546, 1937). 158 [471] Y. Uemura, A. Hasegawa, Y. Kobayashi, T. Yokomori. Tree adjoining grammars for RNA structure prediction. Theoretical Computer Science, 210:277–303, 1999. 578 [472] J. J. Uhl. M and Me. Notices of AMS, 35:1345–1345, 1988. 93 [473] J. D. Ullman. Principles of Database and Knowledge Base Systems. Vol. 1. Computer Science Press, 2. kiadás, 1989. 535 [474] J. D. Ullman, J. . A First Course in Database Systems. Prentice Hall, 1997 (Magyarul: Adatbázisrendszerek. Alapvetés. Panem, Budapest, 1998). 535 [475] L. G. Valiant. The relative complexity of checking and evaluating. Information Processing Letters, 5(1):20– 23, 1976. 159 [476] L. G. Valiant. A bridging model for parallel computation. Communications of the ACM, 33(8):103–111, 1990. 267 [477] L. Varga.

Rendszerprogramok elmélete és gyakorlata (Theory and Practice of System Programs).

Akadémiai Kiadó, 1980. 502 [478] N. J. Vilenkin. Kombinatorika (oroszul). Mir, 1969 (Angolul: Combinatorial Mathematics, Mir, 1972; magyarul: Kombinatorika, Muszaki  Könyvkiadó, 1987, 2. kiadás). 37 [479] B. Vizvári. Egészértéku  programozás. ELTE TTK, 1990. 414 [480] J. von zur Gathen. Modern Computer Algebra. Cambridge University Press, 2003. 92, 93 [481] T. Várady, R. R. Martin, J. Cox. Reverse engineering of geometric models - an introduction. ComputerAided Design, 29(4):255–269, 1997. 683 [482] K. Wagner, G. Wechsung. Computational Complexity. D. Reidel Publishing Company, 1986 (and Kluwer Academic Publishers, 2001). 158 [483] G. Wallace. The JPEG still picture compression standard. Communications of the ACM, 34:30–44, 1991. 455 [484] L. Wang, T. Jiang. On the complexity of multiple sequence alignment. Journal of Computatonal Biology, 1:337–348, 1994. 575 [485] J. Warren, H. Weimer. Subdivision Methods for Geometric Design: A Constructive Approach. Morgan Kaufmann Publishers, 2001. 683 [486] M. S. Waterman. Efficient sequence alignment algorithms. Journal of Theoretical Biology, 108:333–337, 1984. 575 [487] M. S. Waterman, T. F. Smithand, W. A. Beyer. Some biological sequence metrics. Advances in Mathematics, 20:367–387, 1976. 575 [488] D. Watkins. Bulge exchanges in algorithms of QR type. SIAM Journal on Matrix Analysis and Application, 19(4):1074–1096, 1998. 765 [489] Web Dictionary of Cybernetics, Systems. http://pcp.wub.ac.be/ASC.html, 2004. 221 [490] G. Wechsung. Vorlesungen zur Komplexitätstheorie, 32. kötet. B. G. Teubner Verlagsgesellschaft, 2000. 158

786

Irodalomjegyzék

[491] D. Welsh. Codes and Cryptography. Oxford University Press, 1988. 454 [492] J. Wilkinson. Convergence of the LR, QR, and related algorithms. The Computer Journal, 8(1):77–84, 1965. 765 [493] F. M. J. Willems, Y. M. Shtarkov, T. J. Tjalkens. The context-tree weighting method: basic properties. IEEE Transactions on Information Theory Theory, 47:653–664, 1995. 454 [494] F. M. J. Willems, Y. M. Shtarkov, T. J. Tjalkens. The context-tree weighting method: basic properties. IEEE Information Theory Society Newsletter, 1:1 és 20–27, 1997. 454 [495] W. Willinger, V. Paxson. Discussion of „heavy tail modeling and teletraffic data” by S. R. Resnick. The Annals of Statistics, 25(5):1805–1869, 1997. 221 [496] W. Willinger, M. Taqqu, R. Sherman, D. Wilson. Self-similarity through high-variability: statistical analysis of Ethernet LAN traffic at the source level. IEEE/ACM Transactions on Networking, 5:71–86, 1997. 221 [497] W. Willinger, D. Wilson, W. Leland, M. Taqqu. On traffic measurements that defy traffic models (and vice versa): self-similar traffic modeling for high-speed networks. Connections, 8(11):14–24, 1994. 221 [498] F. Winkler. Polynomial Algorithms in Computer Algebra. Springer-Verlag, 1990. 93 [499] I. H. Witten, R. M. Neal, J. G. Cleary. Arithmetic coding for sequential data compression. Communications of the ACM, 30:520–540, 1987. 454 [500] M. J. Wolfe. High Performance Compilers for Parallel Computing. Addison Wesley Longman, 1996. 267 [501] S. Wu, E.. W. Myers, U. Manber, W. Miller. An O(NP) sequence comparison algorithm. Information Processing Letters, 35(6):317–323, 1990. 576 [502] G. Wyvill, C. McPheeters, B. Wyvill. Data structure for soft objects. The Visual Computer, 4(2):227–234, 1986. 683 [503] D. M. Young. Iterative Solution of Large Linear Systems. Academic Press, 1971 (Magyarul: Nagy lineáris rendszerek iterációs megoldása. Muszaki  Könyvkiadó, 1979). 765 [504] C. Yu, D. Johnson. On the complexity of nding the set of candidate keys for a given set of functional dependencies. In Information Processing 74, 580–583. o. North-Holland, 1974. 534 [505] S. Zachos, H. Heller. A decisive characterization of BPP. Information and Control, 69:125–135, 1986. 124 [506] B. Zalik, G. Clapworthy. A universal trapezoidation algorithms for planar polygons. Computers and Graphics, 23(3):353–363, 1999. 683 [507] C. Zaniolo. Analysis and design of relational schemata for database systems. Technical Report UCLA– Eng–7669, Department of Computer Science, University of California at Los Angeles, 1976. 534 [508] C. Zaniolo. A new normal form for the design of relational database schemata. ACM Transactions on Database Systems, 7:489–499, 1982. 534 [509] E. Zehendner. Entwurf systolischer Systeme: Abbildung regulärer Algorithmen auf synchrone Prozessorarrays. B. G. Teubner Verlagsgesellschaft, 1996. 310 [510] J. Ziv, A. Lempel.

A universal algorithm for sequential data compression. IEEE Transactions on

Information Theory Theory, 23:337–343, 1977. 454 [511] J. Ziv, A. Lempel. Compression of individual sequences via variable-rate coding. IEEE Transactions on Information Theory Theory, 24:530–536, 1978. 454 [512] S. I. Zuhovitsky, R. A. Polyak, M. E. Primak. Concave n-person games (numerical methods). Ékonomika i Matematicheskie Methody, 7:888–900, 1971 (oroszul). 360 [513] M. Zuker, D. Sankoff. RNA structures and their prediction. Bulletin of Mathematical Biology, 46:591–621, 1986. 578 [514] AND Software GmbH. Car routing program ”Route Germany”, 1997. 604

Tárgymutató

A, Á

frissítési, 512

AABB, 635 abszolút hiba, 726gy

redundancia, 512 törlési, 512

abszolút hibakorlát, 717

anomálisa mértéke, 481

abszolút optimális algoritmus, 234

áramlási problémához, 595

absztrakt számítógép, lásd számítási modell  környezet ACE, lásd Alkalmazásjellemzo

architektúra szisztolikus, 275

adatábrázolás a komputeralgebrában, 40

A- ´ , 431 ´ aritmetikai kódolás, 429

Adatcsere diagram, 184

A- ´ , 431 ´

adatfolyam, 284 adatfolyam iránya, 287  adatfüggoség, 284

aritmetikai túlcsordulás, 726gy Armstrong-axiómák, 504, 507, 511gy, 519

adatpárhuzamosság, 228, 235

árnyék, 645

adatsebesség, 291

asszociativitás, 101, 116gy

adatszerkezet indexe, 287 adatszerkezet vektor, 287

aszimptotikusan azonos nagyságrend, 234 aszimptotikusan optimális algoritmus, 234

additív metrika, 566

aszimptotikusan önhasonló folyamat, 196  blokk Jacobi-multifelbontás, 739 átfedo

affin függvény, 542

affin transzformáció, 643 aktív él lista, 674 alakzat, 605

Armstrong-reláció, 532

átfordulási probléma, 668  391 átfutási ido,  programok, 456 áthelyezheto

alaphalmaz, 588

átlagos, 232

algebrai  76, 79, 80, 83, 86 bovítés, elem, 78

átlagos kódhossz, 421 átlapolás, 366, 379

számtest, 79, 81 algoritmus

átló, 548, 620 átlósan szigorúan konkáv, 342 átmenet

abszolút optimális, 234 aszimptotikusan optimális, 234 munkahatékony, 233 algoritmus stabilitása, 739  környezet, 182 Alkalmazásjellemzo

testek közötti, 618 átmenetfüggvény, 472  alternatívák, 580 áttekintheto attribútum, 238, 503  533fe külso,

állandó kommunikáció, 237 állapot-átmenetfüggvény, 471  366 állásido,  algoritmus, 499 állományelhelyezo

prím, 520, 534fe automatikus párhuzamosítás, 235 axiómarendszer ellentmondásmentes, 504 teljes, 505

alsó-hierarchia, 144, 149áb, 150 általános kiválasztási feladat, 262

axiomatizálás, 531

általános megoldás, 14 általános párhuzamos gépek, 366

azonnali kód, lásd prex kód

alternatívák, valódi, 581 alternatív áram együttható, 450

B

alternatív megoldások, 600 alulcsordulás, 433  705, 706áb alulvágó szur  o,

B, 556

Amdahl-törvény, 229

BSAT, 140, 144gy

balsodrású, 669

analitikus geometria, 605

báziscímzés, 456 bázisfüggvény, 610

anomália, 480, 481, 501, 511, 519

bázisregiszter, 456

beillesztési, 512

bázisvektor, 606

788

Tárgymutató

be/kimeneti adatsebesség, 307, 308

cellaszerkezet, 269áb, 279áb, 285

 be/kiviteli séma, bovített, 292 be/kivitel kiterjesztése, 291, 292

CGS- ´ ´-G–S- ´  ´,

be/kiviteli séma, 287, 288áb  bovített, 291, 292áb

C, 565, 688 CGS--G–S- ´  ´, 754

befoglaló keret, 648

755

AABB, 648 gömb, 648

Cholesky-felbontás, 734, 737, 764fe C- , 735 ´

hierarchikus, 648

Chomsky-féle normálforma, 557

befoglaló téglalap, 688, 689áb

Church-tézis, 126, 133gy

Bellman–Ford-algoritmus, 266  pont, 607 belso

CIR, lásd információátviteli intenzitással

 ¨   , 557

Clustal-W, 542, 575 C–S-- ´  ´ , 637

bemeneti adatfolyam, 276

Cohen–Sutherland szakaszvágó algoritmus, 636

bemeneti csatorna, 270  jelek halmaza, 471 bemeno

COMNET, 173

Bernstein-polinom, 611 B-, 469gy

CRAY, 723 CRCW, 261

B  , 585 ´  ´ -- ´ - ¨ ¨ - ´  ´ beszúró rendezés, 308 beviteli séma, 269áb

Cox–deBoor-algoritmus, 614

CRCW PRAM, 242, 266 CREW PRAM, 242, 244 CYK-algoritmus, 557

Bézier-görbe, 611, 618gy BF, 493, 494, lásd gazdaságos algoritmus  gazdaságos algoritmus BFD, lásd rendezo

CS

bimátrix-játék, 328

csatorna, 270

bináris fák

csavarvonal, 609 csendes állapot, 559

megszámolása, 28 bináris térpartícionáló fa, 658

csepp módszer, 616

binomiális képlet általánosítása, 26 BLOSUM, 546

CSG, lásd konstruktív tömörtest geometria CSG-fa, 617áb, 800

Bluetooth, 168

*-, 472

bonyolultságelmélet,

csomag, 168

B  ´-E, 45, 63gy, 92

B  ´-E- ´ , 47, 63gy Bresenham-algoritmus, 671, 672 B- ´ , 673

 csomag érkezési idoköz, 199  csomópontszerkesztovel, 180 csomóvektor, 612 csoport, 101

BSP, 242

generátorrendszer, 103

BSP-fa, 658, 681 BSP-- ´ ´ ´ , 681

kommutatív, 101 rend, 101

B-spline, 612, 614 rendszám, 612

C , 565 ´ csúszó ablak, 441

buborékrendezés, 307, 308áb Burrows–Wheeler-transzformáció, 443 B ´ --´ -  - ¨ ¨ ¨ - ´  ´  -

´ ,

599 büntetés-optimális, 590  függvény bünteto additív büntetés, 600  tag, 588 additív bünteto  tényezo,  587, 590 relatív bünteto  módszer, 586, 587, 589 bünteto  módszer, iteratív, 594 bünteto

B  - -´-  -´  , ¨ ´ ¨  587  paraméter, optimális, 592, 599 bünteto BWT- ´ , 444 ´ BWT- ´ , 444 ´

D DCT, 448

DDA, lásd digitális differenciális analizátor algoritmus

DDA- ´ , 671 deriválás, 73 Descartes-koordináta, 606 Descartes-koordinátarendszer, 606  determinisztikus idobonyolultság, 130 determinisztikus Turing-gép, 127 D-, 248, 249, 250

D-- , 759 ´ ´ ´ - ”- ´ ” D-- , 759 ´ ´ ´ - ”- ´ ” DiAligh, 548 DiAlign, 576 Dickson-lemma, 67, 71gy

differenciálalgebra, 72 C

differenciálás, 73

 97 Caesar-rejtjelezo, Canny-féle éldetektor, 708

szabályai, 73  differenciálbovítés, 73

Catmull–Clark-felosztás, 624áb Catmull–Clark felosztott felület, 625 ccNUMA, 224 cella, 269, 689 vezérlésmentes, 295 cellaprogram, 303, 304, 305

differenciál-kiterjesztés, 80 differenciálrésztest, 73

differenciáltest, 72  bovítése, 73  differenciálbovítése, 78

Diffie–Hellman-protokoll, 94

789

Tárgymutató

digitális differenciális analizátor algoritmus, 670 digitális szurés,  695

 o  szur  706 élmegorz  o,  elobetöltés, 470

dinamikus programozás, 584

E ¨   , 557

diszkrét emlékezet nélküli forrás, 419  diszkrét idoszelet, 274

E  , 543 

Dirac-δ, 699 direkt hiba, 719

diszkrét koszinusz transzformáció, 448 diszkrét logaritmus, 108 diszkrimináns, 63gy DMS, lásd diszkrét emlékezet nélküli forrás

E -  ´ , 446  elore-mozgató kód, 445 E  -  , 545  ´  elozéses egyutas ütemezési probléma, 391  elozésnélküli egyutas ütemezési probléma, 391 élpont, 625 eltolás, 441, 605

döntéshozó, 581

E -QR- , 757 ´ ´ eltolásos QR-módszer, 758gy

döntési változó, 672 duál feladat (az egyutas ütemezési problémáé), 391

ember-gép kölcsönhatás, 580  708, 710áb, 804áb emboss-szur  o,

duális fa, 622

emuláció, 166

DNS, 538

entrópia, 420 EP, lásd gazdaságos hatványtípusú algoritmus E, É  EDD, 373, 410, lásd legkorábbi határido egészértéku  lineáris programozás, 599

E  , 261, 262 ´ - ´ egész számok, 39 egy (régi) op, 732 egy (új) op, 732 egyenáram együttható, 450 egyenes, 609 egyenlete, 609 helyvektora, 609 irányvektora, 609 egyenes egyenlete, 640

homogén koordinátákban, 641 egyenlet megoldása, 273 E  ´, 514

egyértelmu  egyensúly, 343 egyértelmuen  dekódolható kód, 421 egyidejuség,  274 egyirányú függvény, 108  rögzítések, 602 egymást követo egységcsoport, 121 egység háromszögmátrix, 732 egységnyi kerekítés mértéke, 722  sokszög, 619 egyszeresen összefüggo egyszeru,  619

ε-alternatívák, 589, 592

monotonitási tulajdonságai, 593 unimodalitási tulajdonság, 592 ERCW PRAM, 242 EREW PRAM, 242, 265 EREW-, 244, 246  érintosík egyenlete, 609  eroforrás, 364, 366  generátor, 103 eros

 ingadozás, 171 eros  ingadozás érkezési idoköz,  eros 199 érték, 332 értékadásmentes jelölés, 273 értéktartomány, 273 sur  u  konvex, 281 értéktartomány transzformációja, 303 értelmezési tartomány, 503 Euler-féle ϕ függvény, 102 exponenciális elem, 78

F fa, 122 levél, 122

F´ -´ -´ -´-´ ´´ , 601  Fan-egyenlotlenség, 323

egyszeru  algoritmus, 252 egyszeru  algoritmus (NF), 492

fekete doboz modellezés, 198 feladat paraméterei, 271

Egyszeru  hálózati menedzsment protokoll, 190

felmelegedési periódus, 192  és alsó becslések, 496 felso

E , 565  - ´

egyszeru  hatvány algoritmus (SP), 495 E , 565  - ´ egyszeru  sokszög, 619

egyutas ütemezési probléma, 366, 389 EH-´ ´, 61 e-kereskedelem, 583

éldetektálás, 707, 708 eldobott csomagok aránya, 172 elem invertálható, 101 inverz, 101 elemi függvénytest, 78, 79, 81 kiterjesztés, 78 elemi függvény, 78 integrálása, 79 elem rangja, 247  Elemzoeszköz, 181

E, 464, 470gy ellipszis, 609

félcsoport, 101

 Hessenberg-alak, 757 felso  felso-hierarchia, 144, 149áb, 150  Felsooktatási Pályázatok Irodája, 4 felület, 607  705 felülvágó szur  o, fényesség, 448  algoritmus, 679, 684 festo FF, 384, 492, lásd mohó ládapakolási algoritmusmohó algoritmus  mohó algoritmus FFD, lásd rendezo Fibonacci-számok, 22 Fickett algoritmusa, 550 FIFO, 480 FIFO sorrend, 410

FIFO- ´ , 473 F-, 469gy Fitch-algoritmus, 554gy xpont módszerek, 321 xpontos számábrázolás, 671 zikai memória, 470

790

Tárgymutató

ipop állapotkapcsoló, 298

grakus megjelenítés, 603

fogoly dilemma, 315

grázomorzmus probléma, 104, 144, 150, 153

fokszám, 104

gravitációs segítség, 583

folyamat, 224, 228  180 folyamatszerkeszto,  folyamfüggoség, 284

grid, 689

forgalomirányító protokollok, 170

grid index, 689 Gröbner-bázis, 63, 67, 68, 69, 70, 88, 92fe minimális, 70

forgalomszervezés, 171 forrás, 418 forrásmodellezés, 418

redukált, 69, 70 Gustafson-Barsis-törvény, 229

forrás modellezése, 429 F, 556

GY

Fourier-Motzkin elimináció, 304

gyengén stabil, 742

Fourier-transzformáció, 697  foegyüttható, 44

G- ´  ¨ ¨ , 254 gyors Fourier-transzformáció, 703

fundamentális megoldás, 15

gyorsítás, 228, 233, 266 lineáris, 233

funkcionális-reprezentáció, 683 F- ´ , 451

futamhossz kódolás, 451  192 futási ido, futószalag-elvu  feldolgozás, 277

szublineáris, 233 szuperlineáris, 233

G , 260 ¨  ¨ - ´ gyur  u,  101

futószalag-regiszter, 277  függoség

egység, 101 egységelem, 101

 egyenloséggeneráló, 525

kommutatív, 101

elágazó, 532

nullelem, 101 nullosztó, 101

funkcionális, 503 ekvivalens családok, 508 numerikus, 532 összekapcsolási, 530 sorgeneráló, 525 többértéku,  525  függoségi bázis, 527

F  , 528, 534fe ¨   ´ - ´  függoségi vektor, 284 fül, 620 fülvágó algoritmus, 621

H hálózat helyi, 168 nagy kiterjedésu,  168 pont-pont, 167 személyes, 168 üzenetszórásos, 167 hálózatok szimulációja, 164 Hamming-távolság, 141 Hanoi-tornyai, 22gy

G

hányados, 44, 66

Gantt-diagram, 412fe

hardver-algoritmus, 268 hármasítás, 134

gát, 573 Gauss-elimináció, 89 G- , 729 ´ G, 760

harmonikus számok, 24 3-agy, 583

gazdagép, 269, 275

3DDDA algoritmus, 650 3D szakaszrajzoló algoritmus, 650, 683

gazdaságos algoritmus (BF), 492

háromdimenziós párosítás, 134, 135, 136

gazdaságos hatványtípusú algoritmus (EP), 495  algoritmus (BFD), 494 gazdaságos rendezo

3-SAT, 134

generatív tervezés, 602 generátorfüggvény, 22

háromszög, 608 balállású, 676 jobbállású, 676

bináris fák megszámolása, 28

háromszögháló, 618

muveletek,  23

háromszögmátrix

generikus operátor, 272, 286, 292

alsó, 308

gép, 364

hasítás, 151 hasonló párhuzamos gépek, 366

gépi epszilon, 722

hasonlósági transzformáció, 750

genetikus algoritmus, 585, 602

G´ -, 722 Givens-módszer, 754 globális helymeghatározó rendszer, 168 gombócevési sebesség, 489

határfelület, 607  366 határido, határregiszter, 457 H ´  ´ - ¨ ¨ , 253

Gotoh-algoritmus, 542 gömb, 607, 608

hatékony megoldás, 603

görbe, 608

hatékonyság, 229, 233, 266, 277 hatékonysági mérték, 233

GPS, lásd globális helymeghatározó rendszer gráf automorzmus, 104 diszjunkt egyesítés, 104 izomorzmus, 104 gráfautomorzmus probléma, 104

H ´ -, 245

abszolút, 231 relatív, 231 hátizsák probléma, 589 háttérmemória, 470 H  , 752, 757gy, 758gy ´ ´

791

Tárgymutató

hatványsor, 42

Internet, 167

házasítás probléma, 135  Heaviside-féle lépcsosfüggvény, 716

internetwork, 167

helyes, 505 helyiértékes számábrázolás, 39

inverz, 101 inverz elem, 101

helyi hálózat, 168

inverz hatványmódszer, 753, 758gy

helyvektor, 606

inverz hiba, 719, 741

helyzetkép, 289

inverz hibaanalízis, 719

henger, 608

inverz mátrix, 99 inverz stabil, 719, 720

Hermite-redukció, 74, 75, 81, 85, 88gy, 92fe heurisztika, 585, 599, 601, 602  585 cserélo,

invariánsok módszere, 673

irányított kapcsolat, 275 irreguláris célfüggvény, 367

heurisztikák, 584

I , 738 ´  ´ - ´

hiba, 717 hibakorlát, 717, 726gy

iterációs vektor, 273 I´-  - , 594 ¨ ´

Hilbert-bázis, 67

iteratív javítás, 764fe

Hilbert-mátrix, 744 hiperexponenciális elem, 78

I´-´ ´ , 747

iteratív mélyítés, 586, 601

Hirschberg algoritmusa, 549

izoparametrikus görbe, 609

hisztogram kiegyenlítés, 696 hitelesség, 110 hivatkozási sorozat, 471 HMMER, 577 holtversenyes esetek, 586 homogén koordináta, 639, 640

H , 20 ´ - ´ homogén lineáris transzformáció, 638, 642

J játék folytonos, 320  kevert bovítése, 327 véges, 315 zérussösszegu,  317

Horowitz-módszer, 75  folyamat, 196 hosszú távon függo  hosszú távú függoség, 171

játékos, 314 jobbkéz szabály, 606

Householder-módszer, 754 hozzárendelési probléma, 589

jól kondicionált, 719

Huffman-algoritmus, 426

Huffman-kódolás, 418 Hurst-paraméter, 196, 199–203

jobbsodrású, 669 JPEG, 419, 447

K k-adik pivotelem, 730 kamera transzformáció, 665

I, Í ideál bázisa, 63 varietása, 63 ideális egyenes, 638 ideális pont, 638 ideális sík, 639

kampus-klaszter, 227 kapacitás, 364

K ´ -, 514, 515áb, 524 kapcsolat, 270, 275 kapcsolat kapacitás, 170 kapcsolatszerkezet, 284 hexagonális, 285

ideállánc, 67, 69

karakterisztikus egyenlet, 15, 749

I-divergencia, 425  idoszelet

kd-fa, 658

karakterisztikus polinom, 749

IEEE, 723

K-- ´ ´ ´ , 659  képernyo-koordinátarendszer, 663 képpont, 638

IEEE Information Theory Society, 454 igény szerint, 470

kerekítés, 722

diszkrét, 274  idovektor, 280

illesztett pár, 540

képszintézis, 605 kerekítési hiba, 722

indexhalmazok transzformációja, 303

keresés, 259 keresési feladat, 259

indexkifejezés, 303 információátviteli intenzitással, 203

kernel, 703

implicit egyenlet, 607

inhomogenitás, 309 inkrementális elv, 662, 670, 674 integrál logaritmikus része, 74 racionális része, 74 integrálás parciális, 73 integrálgeometria, 658, 684 integrállogaritmus, 78 interaktív evolúció, 602 interaktív több feltételes döntéshozatal, 602

keret méret, 171 késés, 170 késleltetés, 230, 275 késleltetett kiértékelés, 42 kétdimenziós párosítás, 134, 135 két fül tétel, 621, 683

K ´  ´ -´ ´ , 464  csere, 599 kettos kezdeti feltétel, 14  állapot, 471 kezdeti vezérlo ki/beviteli séma, 276

kiegyensúlyozás, 744  kielégíthetoség probléma, 133, 134, 139

792 kiemelt klaszter, 227 kifejezések egyszerusítése,  71

Tárgymutató

kulcs, 504, 510, 524  elsodleges, 531

kizetés, 314  kizetofüggvény, 314  kizetomátrix, 317

kulcscsere-probléma, 94

 kizetovektor, 314

kúp, 608  pont, 607 külso külvilág, 270, 275

kihasználtság, 293, 295 kimenetfüggvény, 471 kimeneti csatorna, 270 kimeneti normál forma, 304  jelek halmaza, 471 kimeno

K-  , 511 kulcs tér, 96

kvantálás, 449, 450 kvantikálás, 273

kiszámítható függvény, 129 kiterjedés, 430

L

kiválasztás, 259 kiválasztó rendezés, 308

ládapakolási probléma, 384

kivonatok, 583, 584

lapcserélési algoritmus

klasszikus Cournot-modell, 349

statikus, 471 lapcserélési algoritmusok, 470–480

K´ ¨   , 557

K-E, 44, 92 K-E algoritmus muködése,  45áb klasszikus hibaszámítás, 717 klaszter, 224, 227  algoritmus, 584 klaszterezo k-legjobb algoritmus, 581

LAN, lásd hálózat

laphiba, 472 lapkeret, 470 Laplace-szurés,  708, 709áb, 804áb lapozási sebesség, 481 lappont, 625 lassú indulás algoritmus, 172

Knudsen-Hein-nyelvtan, 559gy

láthatósági feladat, 675

Kologorov-bonylultság, 440

Laurent-sor, 85 Lazard–Rioboo–Trager-formula, 76  lebegopontos aritmetika, 721, 722, 724, 764fe  lebegopontos aritmetikai szabvány, 725

K ´ , 725 ´ - ¨ komplementer feladat, 356 kompozíció, 102, 539 komputeralgebra, 38

komputeralgebra-rendszerek általános célú, 90 speciális célú, 90 kondíciószám, 718, 719, 726gy, 740, 748gy, 763fe, 765fe konjunktív normálforma, 134 konkáv csúcs, 620  függvény, 543 konkáv résbünteto konstansok részteste, 73

 lebegopontos számhalmaz, 726gy  377 leghosszabb megmunkálási ido, legjobbválasz, 321 legkevesebb megmaradt megmunkálás, 410  385 legkisebb megmunkálási ido,  sorrendje, 373 legkorábbi határidok legközelebbi szomszéd keresés, 715fe L- ´   , 458, 469gy

L-- ´ -´  , 460, ´  ´ - ´ 469gy

konstansok variálásának módszere, 21

legrövidebb kör, 582

konstruktív tömörtest geometria, 616

 legrövidebb megmaradt megmunkálási idok, 376  368 legrövidebb megmunkálási ido,

konvex burok, 611 konvex csúcs, 620 konvex-kombináció, 608, 609

K ´  ´ , 700, 704, 710gy, 715

legrövidebb út probléma, 582, 589, 595 lehetséges megoldások, 581, 582, 584 Leibniz-szabály, 73

konvolúció kiterjesztése, 715fe

lényegtelen transzformáció, 448

koordináta, 606 K --, 469gy ´

lépésszám

K --, 470gy ´

átlagos, 232 legjobb esetben, 232

költségvezérelt módszer, 658

legrosszabb esetben, 232

körmentes gráf, 266 környezetfa, 436 K¨ -- ´ ´ ´ , 438 környezetfa súlyozó algoritmus, 437 közönséges pont, 638 köztes számítási tárrobbanás, 42  Kraft-egyenlotlenség, 418, 422 Krichevsky–Tromov-becslés, 435 kriptoanalízis, 95 kriptográa, 94–124

várható, 232 LERC, 154 leszámlálás, 316 L ´  ´ , 506, 507, 524, 533gy attribútumhalmazé, 505, 506, 511gy  funkcionális függoségé, 504, 506, 511gy LF, 491

LFU- ´ , 476 LIFO sorrend, 410

L - ´ ´ , 34

kriptológia, 95

L - ´ ´  ´ , 508, 518, 519, 522

kriptorendszer, 96

lineáris programozás, 595

aszimmetrikus, 96, 99 monoalfabetikus, 97 nyilvános kulcsú, 110 polialfabetikus, 97 szimmetrikus, 96, 99 Kruskal-algoritmus, 266fe Kuhn–Tucker-feltételek, 324

LINPACK, 746 Liouville-elv, 79, 80, 82, 83, 86 listarövidítés, 496 listás ütemezés, 382 logaritmikus  bovítés, 73, 83 derivált, 73, 78

793

Tárgymutató

elem, 78, 81 függvények, 80

háromszög, 647 sík, 647

L- ´ - ´ , 77

M ´ - ´  ´ ´, 634

logikai következmény, 504, 525 log-odds, 546

MF algoritmus, 387, 388 MF ládapakolási algoritmus, 386

L- ´  ¨ ¨ , 251

M-G, 156

LogP, 242, 243

MIB, lásd Menedzsment információs adatbázisból

lokális keresés, 601  cserével, 585, 599, 600 kettos L -  , 585 ´ ´ -- ´ - ¨ ¨ - ´  ´

Mieses-eljárás, 753

lokális optimum megtalálása, 585  lokális vezérelhetoség, 614

MIMD, 224

mikro mutációk, 587 M-R, 112

 LPT, lásd leghosszabb megmunkálási ido

M - ´ ´ , 509, 523, 533fe  minimális törzsfejlodés, 538

LPT sorrend, 378, 385, 410, 412 LRU- ´ , 474

minimális változtatás, 581 mintavételezés, 710

LU-felbontás, 732

mintavételi tétel, 712

LU- , 733 ´

LU-módszer-pointeres-technikával, 734

MISD, 224 modell

LWR, lásd legkevesebb megmaradt megmunkálás lyuk, 470

determinisztikus, 165 dinamikus, 165

lyukszurés,  706

diszkrét, 165 uid-ow, 197

M

folytonos, 165 kötegelt markovi érkezés, 197

M-A, 156

markovi érkezési folyamat, 197

MA az Arthur–Merlin hierarchiában, 117

Markov-modulált Poisson-folyamat, 197

MAN, lásd hálózat

statikus, 165

maradék, 44, 66 Markov-modell, 575fe

sztochasztikus, 165 modellfejlesztési életciklus, 189

masírozó kockák algoritmus, 626

M - ´ , 108 ´ ´

másodrendu  felületek, 646  rendszer, 91 matematikai szakértoi

M --´, 60 ´ M --´, 60 ´

MATLAB, 724, 762 mátrix

moduláris számábrázolás, 39 M ´ , 386

adjungált, 99

mohó algoritmus (FF), 492

determináns, 99

mohó ládapakolási eljárás, 384 molekuláris óra, 566

inverz, 99 sur  u,  310 mátrix és vektor szorzása, 307

monom, 64 monomiális

mátrix invertálás, 734

elem, 80 ideál, 67

mátrixjáték, 332 Matrix Laboratory, lásd MATLAB mátrixszorzás, 269, 270, 272, 278 M  , 760 ´ ´ -- ´

M  ´ ´ -, 761 M  , 761 ´ ´ --´ ´ M  ´ ´ - ¨   -, 761

rendezés, 64 Monte-Carlo-algoritmus, 112 Monte Carlo integráció, 601 MPI, 222 MPI-2, 238 MPMD, 228, lásd többszörös program többszörös

maximális adatátviteli egység, 171

adat

MBR, lásd befoglaló négyszög

MTU, lásd maximális adatátviteli egység

Mealy-automata, 471 M ´ , 566  706, 707áb medián szur  o,

multifelbontás, 737 multifelbontás algoritmus, 738

megengedett akciók halmaza, 314

munkadarab, 364

megengedett megoldás, 581, 588

munkahatékony, 234

megengedett részhalmaz, 588  365 megmunkálási ido,

munkahatékony algoritmus, 233 mutatóugrás, 249

M , 518 

munka, 233, 266

muvelet,  364

megszakítás, 366

MWKR sorrend, 410

mellékosztály

MWR, lásd leghosszabb megmaradt megmunkálás

jobb oldali, 103 mélység-puffer, 675 memória, 275

N

memória elaprózódása, 465

N-BCNF, 522

Menedzsment információs adatbázisból, 190 mérnöki visszafejtés, 683  meroleges

Nash-egyensúly, 314 nccNUMA, 224

vektorok, 606

nccNUMA architektúra, 226 négycsúcs metrika, 566

mesterszál, 239

négyes fa, 657gy

metszéspont számítás

négy-fa, 690, 692áb, 694gy, 715fe

794

Tárgymutató

N´ --, 692

oszd-meg-és-uralkodj algoritmus, 590

négyszögimpulzus, 698

osztó, 309

négyzetes egyenletrendszer, 727 négyzetes szita, 115  blokk Jacobi-multifelbontás, 738 nemátfedo  nemdeterminisztikus idobonyolultság, 130 nemdeterminisztikus Turing-gép, 127 nem-gát, 573 nemlineáris komplementer feladat, 357 Neumann-módszer, 338 N-, 466, 469gy

NF, 492, lásd egyszeru  algoritmus  egyszeru NFD, lásd rendezo  algoritmus Noether-gyur  u,  67 NORMA, 224, 226

 Ö, O ökölszabály, 741 önhasonló folyamat, 196 önhasonlóság, 195  ön-visszavezethetoség, 147 összeadó, 270 összeg típusú optimalizálási probléma, 588  összegzofüggvény, 322 összekapcsolás, 293 összetett muvelet,  274

normálalak, 44 normálforma, 519 BCNF, 519, 520, 533fe Boyce–Codd, 519, 520 3NF, 519, 520 3NF, 519, 520, 534fe 4NF, 519, 528 negyedik, 519, 528 5NF, 531 ötödik, 531

P pálya, 103 PAM, 543, 546 PAML, 577 PAN, lásd hálózat paraméteres egyenlet, 608

P´ - - ´  ´ ¨ ¨ , 251 P´ - -, 264 ´

normalizált, 721

parciális törtekre bontás, 81 párhuzamos

NP-teljes, 584 NP-teljes probléma, 582

párhuzamos: egyenes, 609

NP-teljesség, 133

párhuzamos algoritmus, 738

N-P-I, 146

NRU-   ´ ´, 477 NRU-, 478

NRU- ´ , 477 nulla-egy elv, 252 nullosztó, 101 numerikusan instabil, 719, 726gy numerikusan stabil, 719, 727gy numerikus instabilitások, 603 NURBS, 615

NY nyeregpont, 317 nyílt szöveg, 96 nyilvános kulcs, 96 nyilvános kulcsú kriptográa, 95 nyilvános kulcsú kriptorendszer, 95 nyolc-fa, 694

vektor, 606 párhuzamos: sík, 608 párhuzamos vektorok, 606 páronkénti összeg, 551 páronkénti összehasonlítás, 496 párosítás, 134 párosító algoritmus, 493 páros rejtett Markov-modell, 559 partíció, 456 dinamikus, 463 rögzített, 457 partikuláris megoldás, 14 pászta, 673 Peano rendezés, 694 példány, 503 peremcella, 270 periódus, 97, 301 permanens virtuális áramkör, 191 permutáció, 102 identikus, 103 permutációcsoport, 102 permutációcsoportok, 102

O, Ó

permutációmátrix, 733

oktális fa, 656 Oktatási Minisztérium, 4

PF, 493, lásd párosító algoritmus  párosító algoritmus PFD, lásd rendezo

oligopol játék, 349

PFF, 479

on-line ütemezési feladat, 367 OpenMP, 222, 241

PFold, 577

 OPNET, 221, lásd Optimalizált hálózattervezo

 pivotelemek növekedési tényezoje, 731

optikai szálas elosztott adatinterfész, 168  eszközök, 178 Optimalizált hálózattervezo

pixel, 605 Poisson-pontfolyamat, 653

optimumszámítási feladat, 326 OPT-, 475

poliéder, 619

OPT- ´ , 474 orákulum, 145

orákulumos Turing-gép, 145 origó, 606 ortogonális, 754 ortonormált bázis, 754

O--´ --, 591

pillangó felosztás, 626, 683

poligon, 619

P ¨  ´ , 675  algoritmus, 673 poligonkitölto polinom ábrázolása, 41  összetevoje, 50 primitív, 50 többváltozós, 41, 65

795

Tárgymutató

polinom diszkriminánsa, 63gy

raszteres adatmodell, 686

polinomegyenletek

raszterizáció, 670

ekvivalenciája, 70

Rayleigh-hányados, 752

megoldáshalmaza végessége, 71 megoldhatósága, 71

redundancia, 439 regiszter, 270, 285

véges megoldásai száma, 71

P -BCNF, 523 ´  polinomiális ido-hierarchia, 145, 149 P- ´ - ´ egyhatározatlanú, 45, 63 többhatározatlanú, 66 politóp, 281 pont, 606

R´  ´ ----´ , 462, 469gy ´ - ´ reguláris célfüggvény, 367 rejtett Markov-folyamat, 555 rejtett Markov-modell, 577 rejtett szöveg, 96  rejtjelezo  99 blokkrejtjelezo, affin, 99

pontos, de lassú eljárások, 584 P-- ´ , 433 ´

lineáris, 99 eltolásos, 96

pontos bonyolultság, 234 pont-tartomány négy-fa, 690

helyettesítéses, 99  99 Hill-rejtjelezo,

PRAM, 242

monoalfabetikus, 99

prex kód, 421 prex kód redundanciája, 429gy

permutációs, 99 polialfabetikus, 99

prexszámítás, 244 prekondicionálás, 745

P, 264 Prim-algoritmus, 266fe

transzpozíciós, 99

R´, 36

rekurzív egyenlet, 14, 273 állandó együtthatós lineáris, 15

prím attributum feladat, 534fe

homogén lineáris, 15, 20

51áb P´-E algoritmus muködése, 

inhomogén lineáris, 20, 32, 33 lineáris, 15, 20, 26, 32

P´-E, 51, 92gy primitív gyök, 107 probléma

Diffie–Hellman-probléma, 109

probléma érzékenysége, 739 program, 399

megoldása generátorfüggvénnyel, 26 rekurzív egyenletek, 13 rekurzív felbontás, 690, 691áb R´- ´ , 724 ¨ relációs séma, 503

Projector, 577 projekció, 280

relatív hiba, 726gy, 765fe

projekció iránya, 280, 291

relatív inverz hiba, 747

projekciós mátrix, 280

relativizálható bonyolultsági osztály, 145 relatív lépésszám, lásd gyorsítás  369 rendelkezésre állási ido,

projekciós vektor, 280 projektív egyenes, 641 projektív geometria, 638 projektív sík, 639, 641 projektív szakasz, 641 projektív tér, 638, 639  180 Projektszerkeszto, protokoll zéró-ismeretu,  118

relatív hibakorlát, 717, 722, 726gy, 748gy

rendezés, 262–265, 307 megengedett, 64 monomiális, 64, 71gy rendezett fa, 562  egyszeru rendezo  algoritmus (NFD), 494  gyors algoritmus (QFD), 494 rendezo

protokoll többletterhelés, 171

reprezentánsrendszer jobb oldali, 103

pszeudo-hányados, 50

rés, 541

pszeudo-maradék, 50  366 puha határido,

résbüntetés, 541

PVC, lásd permanens virtuális áramkör

részcsoport, 101  részleges foelemkiválasztás, 730 részstring, 546 reziduális hiba, 739

Q  gyors algoritmus QFD, 494, lásd rendezo

reziduum-tétel, 34

QR-módszer, 758gy QR- , 756 ´

Sylvester-féle alak, 54 rezultánsmódszer, 52

QSM, 242

R-fa, 716

rezultáns, 52, 82, 85

RGB színmodell, 695 Risch-algoritmus, 77, 79, 81, 88 R

R/S, lásd Újraskálázott Módosított Tartomány

exponenciális eset, 84 logaritmikus eset, 81

racionális függvények integrálása, 72 racionális számok, 41

Risch-differenciálegyenlet, 87

rács, 224 rács paraméterei, 271

RNS-térszerkezet, 584 Rodrigues-képlet, 643, 644gy

raktározás, 364

rossz megosztás, 225

R-SAT, 142 R- ´ ´, 462  706 rangszur  o,

 RMON, lásd Távoli meggyelo

Rothstein–Trager-módszer, 76, 82, 85 rögzített partíciók, 457  folyamat, 196 rövid távon függo

796 S

Tárgymutató

SZ

sajátérték, 749, 765fe sajátérték kondíciószáma, 751

S - ´ ´ - ´ ´ ´ , 650

S -  -, 651 ´ ´ - ¨

sajátvektor, 749 sakk, 583, 601

S - ´ ´ - ´ -, 650, 651 szakasz, 609

SAT, 134

szakasz egyenlete, 609

sávmátrix, 735, 736

szál, 228

S  -LU- ´ ´ ´ , 736

S  -C- ´ ´ ´ , 737 S -   ´ -, ´ ´ - ´ ¨ ´ 736

S -   ´ -, ´  - ´ ¨ ´ 736

szalagmátrix, 310 szállítás, 364 szálprogramozás, 235, 241 számítási modell, 232 számítási tárrobbanás, 70 számítógépes biológia, 584

sávszélesség, 170, 230, 310  706 sávszur  o,

szekvencia, 538

S, 759

személyazonosítás, 117 szempozíció, 663

semleges elem, 101

szerencsés prím, 60

Shannon–Fano-algoritmus, 426

szétdarabolás, 276

Shannon–Fano–Elias-kód, 426 sík, 607

szétvágás   o,  517 függoség orz   o  3NF-re, 523 függoség orz

SIMD, 224 SISD, 224 skaláris szorzat, 605 skalárszorzat, 272 skálázás, 744

veszteségmentesen BCNF-be, 521 veszteségmentes összekapcsolású, 512 szimbolikus integrálás, 71

Skeel-féle norma, 742

számítások, 38

SL, lásd listarövidítés

szimbolikus meghatározás, 281

SMP, 224 Sniffer, 188

szimmetrikus mátrixjáték, 334  szimulált hokezelés, 585

SNMP, lásd egyszeru  hálózati menedzsment

szimultán stratégiavektor, 314

protokoll

SNR, lásd jel/zaj hányados sokszög, 619 sorba fejtés, 272 sorozat, 364, 366

színesség, 448 szinkron munkamód, 274 szisztolika, 268 szisztolikus, 268 szisztolikus algoritmus, 269

sorozat csoportosítási probléma, 589 sörétes-puska nukleinsavleolvasás, 574

egyenletes, 278 szisztolikus rács, 268, 269, 310

SP, lásd egyszeru  hatvány algoritmus spektrum, 697

elfajult, 307 hexagonális, 279, 282 lineáris, 308áb

SPMD, 228, lásd egyszeres program többszörös adat S-polinom, 68 Spouge algoritmusa, 550 SPT, 375, 376, 379, 380, 410, 412fe, 414, lásd  |textitlegrövidebb legrövidebb megmunkálási ido  megmunkálási ido SRPT, lásd legrövidebb megmaradt megmunkálási  ido

téglalap alakú, 269áb többdimenziós, 277 szisztolikus rács pereme, 306 szisztolikus rendszer, 268–311, 269 szorzás-összeadás, 274 szorzó, 270 sztochasztikus automata, 141

stabilizátor, 103

szublineáris gyorsítás, 233 szubnormális szám, 725, 727gy

stabilizátor lánc, 103

szuperkulcs, 504, 510

stacionárius, 286

szuperlépés, 242

stacionárius számítás, 277 stacionárius változók, 277, 293, 296

szuperlineáris gyorsítás, 233

stratégia, 314 stratégiahalmaz, 314

T

sugár, 645

támadás

S ´ -  - ´ , 646 S , 660 ´ -  - ´ -- ´

S - , 656 ´ -  - ´ - ´ ´

S - , 651 ´ -  - ´ - ´ ´

aktív, 109 faktorizálási, 114 középen állás támadás, 109 nyílt szövegu,  100

sugárkövetés, 645

passzív, 109

sugárparaméter, 645 súlyfüggvény, 539

rejtett szövegu,  97, 100  kulcs, 100 rejtjelezo

súlyozott eloszlás, 437

választott szövegu,  100, 114

 súlyozott legrövidebb megmunkálási idok, 375

tanácsadó rendszerek, 583

Sutherland–Hodgeman-poligonvágás, 634, 683 SWPT, lásd súlyozott legrövidebb megmunkálási  sorrendje idok

tárgypont, 638

SWPT sorrend, 380

tartomány kalkulus, 515

797

Tárgymutató

tartomány négy-fa, 693

UDC, lásd egyértelmuen  dekódolható kód

taszk, 224, 228

Ukkonen algoritmusa, 550  és alsó becslések ULE, lásd felso

taszkpárhuzamosság, 228  190 Távoli meggyelo, T csomópont, 623

ultrametrika, 564 unimoduláris mátrix, 281, 282

technológiai útvonal, 365

univerzális hasítás, 151

téglatest, 607  teljes foelemkiválasztás, 730

utazóügynök probléma, 589

teljesítmény, 301 teljesítménymérték, 169

útvonal keresése, 581  586, 587, 592 útvonaltervezo,

 275, 283 teljes végrehajtási ido,  366 tényleges határido,

 Ü, U

T- , 565 ´

tér, 605 térbeli frekvencia, 695 térbeli indexelés, 687 térbeli koordináták, 271, 281 térbeli középvonal módszer, 658  tér-ido-leképezés, 278, 279, 280, 303 térinformatika, termelési feladat, 365 természetes összekapcsolás, 512, 522 test, 101, 102, 607 test középvonal módszer, 658 tesszeláció adaptív, 622 tesszelláció, 618  tetszoleges futási ideju  algoritmusok, 586, 601 tevékenység, 364  TIAT, lásd tranzakció érkezési idoköz titkos kulcs, 96 tórusz, 607 többutas ütemezési probléma, 366, 397  több választási lehetoséges optimalizálás, 580, 581  több választási lehetoséges teszt, 581  több választási lehetoséget adó algoritmus, 581  több választási lehetoséget kínáló rendszer, 580, 586 több választást kínáló rendszer, 581 példa, 582 többváltozós polinom  65 fomonomja,  fotagja, 65 multifoka, 65 tagjai, 65 tökéletes titkosság, 100 tömb feje, 248 tömbrangsorolás, 247 tömörítés veszteséges, 419 veszteségmentes, 419 töröttvonal, 618 transzcendens elem, 78, 81 elemi függvénytest, 78 elemi kiterjesztés, 78 transzformáció, 638 transzformáció-kiterjesztés-minta modell, 197  tranzakció érkezési idoköz, 199 tranziens függvény, 698 tri-lineáris közelítés, 626 túlcsordulás, 763fe

utazóügynök probléma (TSP), 582, 584, 599, 603

ütközésfelismerés, 628, 645 üzenet, 96

V vágás, 628, 633, 663, 668 szakaszok, 633  170 válaszido, választás, 437 választott szövegu  támadás, 123 valós ideju  problémák, 581 váltási hely, 234 változó intenzitásirányítás, 203 VBR, lásd változó intenzitásirányítás véges játék, 315  döntés, 580, 583 végso vektor, 605 abszolút értéke, 605 összeadás, 605 skaláris szorzás, 605 számmal szorzás, 605 vektoriális szorzás, 606 vektorizáció, 618 vektoros adatmodell, 686 véletlen séta, 141 veremtulajdonság, 490 veszteséges tömörítés, 419 veszteségmentes tömörítés, 419 vezérfa, 547 vezérlés globális, 296 helyi, 296 vezérlés, osztott, 300  állapotok halmaza, 471 vezérlo  vezérlopont-sorozat, 610 viewport, 687 Vigenère-négyzet, 97 virtuális lap indexe, 471 virtuális memória, 470 virtuális világ, 605 visszaállítás, 296áb visszafelé indukció, 318 V´ ´ , 728 visszalépés, 139, 140  visszavezethetoség, 133, 139gy Viterbi-algoritmus, 557 voxel, 626

Turing-gép, 126, 127áb, 145 Turing-gép szemantikája, 128 Turing-gép szintaxisa, 127  Turing-visszavezethetoség, 145, 148

W WAN, lásd hálózat

W-, 679 W-, 469gy, 470gy WS, 479

U, Ú

WS-, 479

798 Y

Tárgymutató

z-buffer, 675

YCbCr-transzformáció, 447

z-buffer algoritmus, 675

Z

Z--  ´ - ´ ¨ , 678 zéró-ismeretu  protokoll, 119

zajmentes kódolás tétele, 422

Ziv–Lempel tömörítés, 440

zártság, 101

Z-transzformáció, 32

Z--, 676

Színes ábrák és ismertet®k

Ebben a fejezetben a kötet legfontosabb színes ábráit és a hazai informatikai    bemutató anyagokat gyujtöttük felsooktatás foszerepl oit  össze.   Eloször a fekete-fehér alapszínu  egyetemi ismertetok (Babe¸ s-Bolyai Tudományegyetem, Budapesti Muszaki  és Gazdaságtudományi Egyetem,  (Debreceni Pécsi Tudományegyetem), azután a színes egyetemi ismertetok  Egyetem, Eötvös Loránd Tudományegyetem, Eszterházy Károly Foiskola és Szegedi Tudományegyetem) következnek. Ezután az 5. fejezet (Hálózatok szimulációja) fejezet hat, azután a 6. fejezet (Párhuzamos számítások) egy, majd a 16. (Graka) fejezet négy és végül a 17. fejezet (Térinformatika) nyolc színes ábráját mutatjuk be – abban a  sorrendben, ahogyan a könyvben elofordulnak.

800

Színes ábrák és ismertetok 

BABES-BOLYAI ¸ TUDOMÁNYEGYETEM MATEMATIKAI ÉS INFORMATIKAI KAR RO 400084 Cluj-Napoca, Str. Kogalniceanu 1 Tel: +40-264-405327, Fax: +40-264-591906, Email: [email protected]; Honlap: http://www.cs.ubbcluj.ro BBBE MATEMATIKAI ÉS INFORMATIKAI KARA  A kolozsvári BBBE Matematikai és Informatikai Karán a következo szakokon folyik alapképzés: matematika (román és magyar nyelven), informatika (román, magyar és angol nyelven), matematika-informatika (román, magyar és német nyelven), valamint alkalmazott matematika (román nyelven). A magyar tagozaton évente mintegy 80–100 hallgató kezdi el tanulmányait (matematika szakon 10–15, informatika szakon 40–50,  70 körüli az államilag támomatematika-informatika szakon 30-40). Ebbol gatott helyek száma. Azok a hallgatók, akik elvégzik a pedagógiai modult is, tanári diplomát is szerezhetnek. A magyar tagozaton a hallgatók minden tárgyat tanulhatnak magyarul, de a választható tárgyak esetében (amelyek az egyes tagozatokon különbözhetnek) választhatnak más nyelvu  tárgyakat is. A karon mesterképzés (MSc) is folyik román, magyar és angol nyelven.  bevezetMagyar nyelven számítógépes matematika szak létezik. 2005-tol  3+2-es rendszert, azaz a 3 éves jük a bolognai egyezménynek megfelelo alapképzést és a 2 éves mesterképzést. Jelenleg az alapképzés 4 év, a mesterképzés pedig további 1 év. A magyar tagozat oktatói igyekeznek magyar nyelvu  szakkönyveket is beszerezni a kari könyvtár számára. Így sikerült néhány példányt szerezni az Algoritmusok (Muszaki  Könyvkiadó, 1997), az Osztott algoritmusok (Kiskapu Kiadó, 2002), a Párhuzamos algoritmusok (ELTE Eötvös Kiadó, 2003)  is. és az Új algoritmusok (Scolar Kiadó, 2003) címu  tankönyvekbol Az Informatikai algoritmusok címu  tankönyvet az informatikus alap tárgyaihoz fogjuk használni: Algoritmika, Programozás, képzés következo Adatszerkezetek, Algoritmusok elemzése és bonyolultsága, Numerikus módszerek, Operációkutatás, Számítógép-architektúrák, Operációs rendszerek, Mesterséges intelligencia, Az adatbázisok alapjai és Számítógépes graka. Kolozsvár, 2004. augusztus 18. Dr. Kása Zoltán egyetemi tanár dékánhelyettes

801

Színes ábrák és ismertetok 

 BUDAPESTI MUSZAKI EGYETEM VILLAMOSMÉRNÖKI ÉS INFORMATIKAI KAR 1117 Budapest, Magyar Tudósok krt. 2. Tel: 463-1501, Fax: 463-3580, Email: [email protected] BME VILLAMOSMÉRNÖKI ÉS INFORMATIKAI KARA A BME Villamosmérnöki és Informatikai Kar alaptevékenységének  doktori meghatározó eleme az egyetemi mérnökképzés és az erre épülo (PhD) képzés villamosmérnöki és muszaki  informatika szakon. A mérnökképzésben évfolyamonként közel 500 villamosmérnöki, és nagyjából ugyanennyi informatikus hallgató vesz részt. A két egyetemi szintu  szak oktatására  elméleti alapképzés, a mély szakmai ismereteket adó szakképzés, a az eros széles területen gyakorlati tudást nyújtó laboratóriumi oktatás, és az önálló  A szakképfeladatok megoldására irányuló mérnöki gyakorlat a jellemzo. zés során a villamosmérnöki hallgatók a beágyazott információs rendszerek, a híradástechnika, a távközlés és telematika, a számítógép technika, az irányítástechnika, a robotinformatika, valamint az elektronika és energetika területeinek valamelyikében mélyedhetnek el. Az informatikus hallgatók választható moduljai a rendszer- és szoftverfejlesztés, az infokommunikáció, a médiainformatika, az intelligens autonóm rendszerek és a gazdasági informatika. A villamosmérnöki és informatikai szakterület doktori képzésében a hall nemzetközileg is elismert tudományos iskoláihoz kapcsogatók – a kar eros, lódva – alapkutatással és alkalmazott kutatással foglalkoznak, de emellett szervezett szakmai kurzusokon folytatják tanulmányaikat és részt vállalnak a kar oktatási tevékenységében is. Az Informatikai algoritmusok címu  tankönyv többek között az informatika szaknak a Bevezetés a számításelméletbe, Formális nyelvek, Algoritmusok elmélete, Adatbázisok, Operációs rendszerek, Számítógépes graka és képfeldolgozás, valamint Kódelmélet tárgyaihoz, a villamosmérnöki szaknak pedig az Informatika, Számítástudomány alapjai, Számítógépes graka és animáció nevu  tárgyaihoz használható jegyzetként, illetve hasznos  olvasmányként. kiegészíto Budapest, 2004. augusztus 16. Dr. ARATÓ PÉTER egyetemi tanár dékán

802

Színes ábrák és ismertetok 

PÉCSI TUDOMÁNYEGYETEM TERMÉSZETTUDOMÁNYI KAR, MATEMATIKAI ÉS INFORMATIKAI INTÉZET H-7624 Pécs, Ifjúság útja 6.

Telefon/Fax:

+36 (72) 503-615,

E-mail: [email protected]

PÉCSI TUDOMÁNYEGYETEM MATEMATIKAI ÉS INFORMATIKAI INTÉZETE

A PTE Természettudományi Karán hosszabb ideje folyik számítástechnika szakos  tanárképzés, elsosorban a technika, illetve matematika tanárszakkal együtt szakpárban. Az  fejlesztéseinek eredményeként önálló informatikus szak indítására keelmúlt évek jelentos rült sor a 2003/2004 tanévben, ekkor indult el a TTK-n a programozó matematikus szak  évfolyama. Ezeknek a szakoknak a gazdája a Matematikai és Informatikai Intézet, elso amely ugyanakkor ellátja a Karon az informatika ismeretanyagának oktatását közismereti tantárgyként, illetve szaktárgyként a többi természettudományi szakos hallgatók számára. Ebben az évben két új informatika orientált szak akkreditálására került sor a  kezdve elindul a képzés a zikus inforTermészettudományi Karon – a 2004/2005 tanévtol  az informatika matikus és könyvtáros informatikus szakokon. A két szak közül az elso komoly elméleti alapozását is megköveteli.  informatikus alapképzési szak akkreditációs anyagának Jelenleg a programtervezo  benyújtása ez év szeptemelkészítése van folyamatban, s az akkreditációs eljárásra történo berében fog megtörténni. A szak indítása a 2005/2006 tanévben várható. Az Informatikai algoritmusok címu  könyvet (hasonlóan az Új algoritmusok címu  és   informatikus alapképmás korábban elkészült könyvekhez) elsosorban a programtervezo zési szakon fogjuk használni tankönyvként. Várhatóan fontos segítséget fog jelenteni több tantárgy oktatásában: Számításelmélet, Operációkutatás, Adatbázisok elméleti alapjai, Számítógépes graka, Numerikus módszerek. A könyv számos fejezete hasznos oktatási anyagot képez a TTK-n jelenleg folyó matematika tanár és az ebben az évben induló zikus informatikus képzéshez, továbbá a PTE más informatikai irányú képzéseihez is.

Pécs, 2004. július 15. Dr. Szeidl László egyetemi tanár igazgató

803

Színes ábrák és ismertetok 

DEBRECENI EGYETEM INFORMATIKAI KAR 4010 Debrecen, Pf. 12. E-mail: [email protected] Telefon: (52) 489-100, Fax: (52) 416-857

DEBRECENI EGYETEM INFORMATIKAI KARA A Debreceni Egyetem Informatikai Kara a Kelet-Magyarországi régióban az egyetlen akkreditált egyetemi szintu  informatikai szakemberképzés gazdája. A kar öt tanszékén (Alkalmazott Matematika és Valószínuség-számítás,  Információ Technológia, Komputergraka és Könyvtárinformatikai, Szá mítógépes Rendszerek és Hálózatok, Számítógéptudomány) dolgozó 6 professzor, 13 docens (fomun katárs), 21 adjunktus (tudományos munkatárs), 14 tanársegéd és 21 felsofokú végzettségu  számítás technikai munkatárs jelentos, nemzetközileg is jegyzett szellemi potenciált képvisel. A Informatikai Karon jelenleg

• • • • •

 informatikus (nappali, 6 félév, alapképzési BSc szint); programtervezo  programozó matematikus (esti, 8 félév, foiskolai szint);  matematikus (nappali, 10 félév, egyetemi szint); programtervezo  10/6 félév, egyetemi szint); informatikatanár (nappali, levelezo,  10/6 félév, egyetemi szint) informatikus könyvtáros (nappali, levelezo,

szakokon folyik képzés.  informatikus, programozó- és programtervezo  matematikus szakokon olyan komplex szakA programtervezo  szakemberek képzése a cél, akik képesek a mindennapi élet által felvetett mai elméleti ismeretekkel rendelkezo  megoldási módszerek megkeresésére, illetve gyakorlati problémák tudományos igényu  modellezésére, a megfelelo  kidolgozására, képesek ilyen feladatok elvégzésére szervezodött csoportok szakmai irányítására, rendelkeznek a  elméleti-, módszertani- és nyelvismeretekkel. A progszakterületükön folytatható kutatásokhoz szükséges alapveto  informatikus alapképzési BSc szakon a képzés Magyarországon eloször  ramtervezo 2004-ben a Kar gondozásában indult. Ennek, az ún. Bolognai folyamatnak a keretében folyó képzésnek fontos szerepe lesz abban, hogy hazánk  az Európai Unió tagjaként szervezetileg is felzárkózzék az európai felsooktatási térséghez. A szakindítás az infor  matikai képzés kínálatában elsosorban nem mennyiségi, hanem minoségi változást eredményez:



 A nemzetközi mércéhez alkalmazkodó képzési rendszer és végzettség jelentosen növeli végzett hallgatóink  bekapcsolódásra. esélyeit a nemzetközi munkamegosztásba történo



A mesterképzés (MSc) bevezetése után világos helyzetet teremt a továbbtanulásnál.

A Kar által gondozott tanárszakokon a cél olyan magas szintu  informatikai, illetve pedagógiai és általános mu  tanárok képzése, akik szakirányú és pedagógiai ismereteik alapján képesek az informatika veltséggel rendelkezo  tanár képes lesz a hazai tanítás értékes hagyományainak tanítás minden szintjén feladatok ellátására. A leendo  és színvonalának megorzésére, a képzésben fontos szerepet játszik továbbá a kitekintés e szakterület oktatásának európai hagyományaira is.  Informatikus könyvtáros szakon olyan felsofokú szakemberek képzése a cél, akik tanulmányaik során elsajátították a könyvtár- és tájékoztatástudomány korszeru  elméleti alapismereteit, továbbá az önálló gyakorlati alkalmazásukhoz szükséges ismereteket, beleértve az információkezelést, illetve az erre vonatkozó kutatások módszertanát is.  jelenleg 1700. Ezonfelül teljes egészében az InforA Kar saját szakjain oktatott hallgatók létszáma jelentos,  matikai Kar gondozza más karok, így a Közgazdaságtudományi, Jogi, Muszaki  Foiskolai Kar informatikai kurzu szerepet játszanak a hat programmal muköd  Matematika és Számítástudományok sait is. Munkatársaink jelentos  o  hallgatót beiskolázva. doktori (PhD) iskolában is évi 8–10 nappali és 10–20 levelezo  A Kar kiterjedt nemzetközi kapcsolati lehetové teszik, hogy évente több tucat hallgatónk vegyen részt külföldi  részképzésben Európa és a világ jó nevu  felsooktatási intézményeiben.  hazai szakmai együttmuködésének Munkatársaink gyümölcsözo  egy szép példája az Informatikai algoritmusok címu  könyv elkészítése is, amelyet minden bizonnyal Debrecenben is haszonnal tanulmányoznak majd az érintettek. A Debreceni Egyetem klasszikus értelemben vett egyetem. 18 karán és kari jogállású intézetében nemcsak elszigetelt szakemberképzés folyik, hanem a szakterületek együttmuködésén,  a sokszínuség  kihasználásán  kulturális életével, szabadidos  kínálatával ebben méltó partnere az egyetemnek alapuló értelmiségképzés. Pezsgo Debrecen városa is. Debrecen, 2004. augusztus. 16. Dr. Fazekas Gábor mb. dékánhelyettes

804

Színes ábrák és ismertetok 

EÖTVÖS LORÁND TUDOMÁNYEGYETEM INFORMATIKAI KAR

1117 Budapest, Pázmány Péter sétány I/C. Tel: 381-2139, 381-2222 Fax: 381-2140

 mateAz ELTE Informatikai Karán jelenleg a nappali tagozaton programtervezo matikus (a 2003/2004-es tanévben 1847 államilag nanszírozott hallgató), informatikatanár (190 hallgató) és térképész (96 hallgató) egyetemi szakon folyik képzés.  Ugyanebben a tanévben az esti tagozaton programozó matematikus foiskolai alapsza  kon (332 hallgató), számítástechnika-tanár foiskolai alapszakon (57 hallgató) és levelezo tagozaton (228 hallgató) is tanultak hallgatók. Az Informatikai Doktori Iskolának 23 államilag támogatott hallgatója volt.  informatikus alapszak A Kari és az Egyetemi Tanács jóváhagyta a programtervezo  (BSc) akkreditációs pályázatát. A szak indításának tervezett idopontja a 2005/2006-os tanév. A Kar legfontosabb rendszeres rendezvényei az Ipari Nap (a 2003/2004-es tanévben az ELTE Eötvös Napok keretében volt május 13-án), a Neumann-nap (2003. november 6-án  hagyományteremto  szándékkal) és a Térinformatikai Világnap programjában volt az elso, való részvétel (2003. november 19.). Az Informatikai Kar oktatói aktív szerepet játszottak az Algoritmusok (Muszaki  Könyvkiadó, 1997), az Osztott algoritmusok, (Kiskapu Kiadó, 2002), a Párhuzamos algoritmusok (ELTE Eötvös Kiadó, 2003), a Programozási nyelvek (Kiskapu Kiadó, 2003) és az Új algoritmusok (Scolar Kiadó, 2003) címu  tankönyvek megjelenésében.  informatikus alapképAz Informatikai algoritmusok címu  tankönyvet a programtervezo zés Bevezetés a matematikába, Programozás módszertani alapjai, Számításelmélet, Numerikus módszerek, Operációkutatás, Architektúrák és operációs rendszerek, Az adatbázisok elméleti alapjai és a Számítógépes graka címu  tantárgyaihoz fogjuk tankönyvként használni.  matematikus mesterképzésben a tankönyvet az AdatbázisA jelenlegi programtervezo rendszerek, Graka, Hálózatok, Komputeralgebra, Mesterséges intelligencia, Operációkutatás, Párhuzamos rendszerek, Térinformatika sávok oktatásában hasznosítjuk.  kezdve az Oktatási Minisztérium támogatja elektronikus tankönyvek létreho2004-tol zását. A pályázaton 4 informatikai és 6 matematikai könyv kapott támogatást. Ezek közül 4 elektronikus könyvnek – Fóthi Ákos és Horváth Zoltán (Bevezetés a programozásba),  – Informatikai algoritmusok I.), Iványi Antal (Párhuzamos Iványi Antal (szerkeszto algoritmusok), Stoyan Gisbert (Numerikus módszerek I.) – és három nyomtatott könyvnek – Demetrovics János és Békéssy András (Adatbázisrendszerek), Iványi Antal (Informatikai  az ELTE IK oktatói. algoritmusok I., II.) és Stoyan Gisbert (Mathlab 6.5.) – a szerzoi Ugyancsak támogatást kapott Klinghammer István, Mosonyi László és Török Zsolt A Kárpát-medence tektonikus térképei címu  CD-je. Budapest, 2004. szeptember 15. Dr. Kozma László dékán

805

Színes ábrák és ismertetok 

 Eszterházy Károly Foiskola Természettudományi Kar MATEMATIKAI ÉS INFORMATIKAI INTÉZETE

3300 Eger, Leányka út 4. E-mail: [email protected] Telefon:06 (36) 520-400

/ 4223 Fax: 06 (36) 520-478

 ESZTERHÁZY KÁROLY FOISKOLA MATEMATIKAI ÉS INFORMATIKAI INTÉZETE Az MM 51018/1989.-XVI. sz. ügyiratában Pusztai Ferenc az Akadémia egyetértésével  a EKF eloterjesztésére  1989 szeptember 1-tol számítástechnika szakot alapított, amelynek  alapján a foiskolánkon az 1989-90-es tanévben matematika-számítástechnika szakon az   országban elsoként elindult a szakos tanárok képzése. A késobbi évek során valamennyi  foiskola az engedélyezett tanterv és szakalapítás alapján elindította a számítástechnika szakos tanárképzést. Az eltelt több mint 10 évben közel 1000 számítástechnika szakos általános iskolai tanári diplomát adtunk ki nappali és esti tagozaton. A felhalmozott óriási szakmai tapasztalat és a Debreceni Egyetem támogatásának   eredményeként a foiskolák között eloször 2002/2003-as tanévben elindult a programozó  évfolyama nappali és esti tagozaton. matematikus szak elso  informatikus alapszak (BsC) 2005-ös  2004 oszén beadjuk a programtervezo indításának kérelmét.  Foiskolánk 2004-ben akkreditálta az informatikus könyvtáros egyetemi szakot, így a  foiskolai  meglévo szakok mellett már egyetemi szinten is tanulhatnak intézményünkben informatikát a hallgatók.   közalkalmaA Matematikai és Informatikai Intézetnek 12 foállású, teljes munkaidos  minosített   3 éven zotti munkaviszonnyal rendelkezo oktatója van, 1 éven belül további 2 fo,  szerzi meg a PhD tudományos fokozatot. Ezzel biztosított a minoségi  belül további 4 fo informatikai képzés iránti elkötelezettség.  Az Informatikai algoritmusok címu  könyvet elsosorban a számítástechnika tanári  informatikus alapszakon fogjuk használni. 2004-ben az szakon és a programtervezo Oktatási Minisztérium által meghirdetett pályázat támogatja az elektronikus tankönyvek létrehozását. A pályázaton négy elektronikus informatikai könyv kapott támogatást,  egy az Informatikai algoritmusok. amelybol   C# programozási Az Eszterházy Károly Foiskola oktatóinak gondozásában készülo nyelv címu  elektronikus tankönyv szintén a sikeres pályázók körébe tartozik.  az interneten Az intézettel és a képzésekkel kapcsolatos további információk elérhetok a http://matinf.ektf.hu címen. Eger, 2004. szeptember 10.  Dr. Kovács Emod  foiskolai  tanszékvezeto docens

806

Színes ábrák és ismertetok 

SZEGEDI TUDOMÁNYEGYETEM TERMÉSZETTUDOMÁNYI KAR INFORMATIKAI TANSZÉKCSOPORT 6720 Szeged, Árpád tér 2. Levelezési cím: 6701 Szeged, Postaók 652. Telefon:

+36 62 546396, Fax: +36 62 546-397

E-mail: [email protected]

SZEGEDI TUDOMÁNYEGYETEM INFORMATIKAI TANSZÉKCSOPORTJA A Szegedi Tudományegyetem Természettudományi Kara 1921-ben kezdte meg muködését,  amikor Szeged városa befogadta a Kolozsvárról áttelepült tudományegyetemet. A Természettudományi Kar oktatási és kutatási tevékenységét tudományterületi alapon felosztotta intézetei, tanszékcsoportjai között. Hat tanszékcsoport muködik,  amelyek mindegyike részben önálló kutató és oktató intézetként is felfogható. A Szegedi Tudományegyetem képzési rendszerén belül az Informatikai Tanszékcsoport öt, az informatika tudományághoz tartozó szaknak a  matematikus gazdája: programozó matematikus szak, programtervezo szak, közgazdasági programozó matematikus szak, muszaki  informatikai szak és informatika tanár szak. Az Informatikai Tanszékcsoport 1990ben alakult, ekkor vette át a nagy múltú szegedi informatikusképzés gondozását a TTK Matematikai Tanszékcsoportjától. A öt tanszéket (Alkalmazott Informatika Tanszék, Képfeldolgozás és Számítógépes Graka Tanszék, Számítástudomány Alapjai Tanszék, Számítógépes Algoritmusok és Mesterséges Intelligencia Tanszék, Szoftverfejlesztés Tanszék) magában foglaló Informatikai Tanszékcsoport oktató- és kutatómunkáját az MTA-SZTE Mesterséges  is nyitva Intelligencia Tanszéki Kutatócsoport is segíti. A hallgatóink elott  álló intézeti könyvtárunk folyamatosan bovül, könyvállománya meghaladja  A Tanszékcsoaz 5000 kötetet és közel 200 tudományos folyóirat is elérheto. port a gyakorlati oktatásra kiválóan felszerelt számítógépes kabinettermeket üzemeltet, amelyekben a hallgatók a tantervi órákon kívül is dolgozhatnak és számukra a szabad Internet-hozzáférés is biztosított. A hallgatóink bekapcsolódhatnak a tanszékeken folyó kutatásokba, és ezt végzés után folytathatják PhD képzés keretében. A tudományos munka eredményeként rendszeresen színvonalas Országos Tudományos Diákköri dolgo zatok születnek. A Tanszékcsoport lehetoség szerint támogatja a hallgatók külföldi részképzését. Ennek érdekében külföldi partnerekkel több nemzetközi projektben vesz részt az Intézet, melynek eredményeként számos hall gató élhet a külföldi részképzés lehetoségével.  sport és kulturális élete ragyogó lehetoségeket  Szeged város pezsgo nyújt a tanulás mellett pihenni, kikapcsolódni és szórakozni vágyó hallgatóinknak. Szeged, 2004. szeptember 2. Dr. Csirik János  egyetemi tanár tanszékcsoportvezeto

Színes ábrák és ismertetok 

 19.1. ábra. A beérkezési idoközök nagy változékonysága. Az 5.10. ábra színes változata.

19.2. ábra. A kerethosszak hisztogramja. Az 5.11. ábra színes változata.

807

808

Színes ábrák és ismertetok 

19.3. ábra. Adatcsere diagram. Az 5.15. ábra színes változata

19.4. ábra. Késleltetések összegzése. Az 5.16. ábra színes változata

809

Színes ábrák és ismertetok 

 19.5. ábra. A sávszélesség hozzáadásának hatása a válaszidore. Az 5.19. ábra színes változata.

19.6. ábra. A Pareto-eloszlás 400 bájt várható érték és H változata.

= 0.55

Hurst-paraméter esetén. Az 5.28. ábra színes

810

Színes ábrák és ismertetok 

19.7. ábra. Hálózati topológia. Az 5.50. ábra színes változata.

X1

= 2, 5, 8, 11, 13, 16, 21, 25 X

pn

X

1

X2

= 4, 9, 12, 18, 23, 27, 31, 34

ps

X

1

2, 8, 13, 21

5, 11, 16, 25

4, 12, 23, 31

összefésülés

L1

pn

X

2

ps 2

9, 18, 27, 34

összefésülés

= 2,4,8,12,13,21,23, 31

L2

= 5,9,11, 16,18,25,27, 34

összekeverés

L

= 2, 5,4, 9,8,11, 12,16, 13,18,21, 25,23, 27, 31, 34 összehasonlítás és csere 2,4,5, 8,9,11,12,13, 16,18,21,23,25,27, 31, 34

19.8. ábra. 16 szám rendezése a P´ - - ´  ´ ¨ ¨ algoritmussal. A 6.8. ábra színes változata.

811

Színes ábrák és ismertetok 

19.9. ábra. A konstruktív tömörtest geometria alapmuveletei  egy f implicit függvényu  kúpra és egy g implicit függvényu  gömbre: egyesítés (max( f , g)), metszet (min( f , g)), halmaz-különbség (min( f , −g)). A 15.9. ábra színes változata.

U \ U U 19.10. ábra. Összetett objektum felépítése halmazmuveletekkel.  A CSG-fa gyökere az összetett objektumot, a levelei a primitíveket azonosítják. A többi csomópont a halmazmuveleteket  adja meg (U: egyesítés, A 15.10. ábra színes változata.

/: különbség).

812

Színes ábrák és ismertetok 

19.11. ábra. Az eredeti háló, valamint egyszer, kétszer és háromszor felosztott változatai. A 15.19. ábra színes változata.

19.12. ábra. Képszintézis virtuális kamerával. A 15.30. ábra színes változata.

19.13. ábra. Egy LANDSAT muhold  felvétele: az RGB sávok és a sávokból összeállított kép. A 16.14. ábra színes változata

Színes ábrák és ismertetok 

813

19.14. ábra. A hisztogram kiegyenlítéssel megnövelt kontrasztú kép. A 16.19. ábra színes változata.

 19.15. ábra. Az erosen felnagyított kernel mozgása a képen (LANDSAT képrészlet). A 16.24. ábra színes változata.

814

Színes ábrák és ismertetok 

19.16. ábra. A bal oldali kép az eredeti, míg a jobb oldali egy kilenc pontos (9

× 9 pixeles) medián-szurt  kép. A

16.30. ábra színes változata.

19.17. ábra. A bal oldali kép az eredeti, a jobb oldali az emboss-szurt  változat. A 16.31. ábra színes változata.

Színes ábrák és ismertetok 

815

19.18. ábra. A bal oldali az eredeti kép, a jobb oldali a Laplace-szurt  változata. A 16.32. ábra színes változata.

19.19. ábra. A bal oldali az eredeti kép, a jobb oldali az emboss-szurt  változata. A 16.33. ábra színes változata.

816

Színes ábrák és ismertetok 

19.20. ábra. A

τ rácsállandójú Dirac-δ sorozattal mintavételezett felszín. A 16.35. ábra ismétlése

19.21. ábra. Törökbálint domborzati modelljének perspektivikus megjelenítése északi irányból. A 16.36. ábra színes változata.

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF