Kódfejtő blog

Magánhangzó azonosítás trilaterális elemzéssel 1. rész Az elemzés

2012. február 25. 09:38 - L. B. Alberti

Ehez a feladathoz, kellett némi előkészület, így egy kicsit elhúzódott a poszt megjelenése. Azért, hogy a szöveg nekem se legyen ismerős, a következő módon lett generálva: Jókai Mór, Egy magyar nábob című regényének első fejezetéből a szöveg át lett alakítva ékezetmentesre. Ez után, egy véletlenszám generátorral kiválasztott szóköztől számítva 180 karakternyi szöveg lett kiemelve. Ez ha nem szóközig tartott, akkor kiegészült szóközig. (azért, hogy teljes szó legyen az utolsó). Eltávolításra kerültek a szóközök, és egy véletlenszerűen összekevert 26 betűs kód ABC-vel egy egyszerű helyettesítéses eljárással kódolva lettek a betűk (A betű a kód ABC első betűjével, B a másodikkal és így tovább). Az eredményt 5-ös csoportokra bontva kaptuk. Ha az utolsó csoport kevesebb volt 5 karakternél, kiegészítésre került olyan rejtjelekkel, amik korábban nem voltak használva (nullitások).

Akkor lássunk is hozzá.

Magánhangzó azonosítás trilaterális gyakoriságelemzés alapján.

Ezt a titkosírást generálta a program:

 
  IHGME BYBRA GRBWU BELBN DXHDG
  LEGLG HHGYX LEQAY GEYGQ XWUGR
  BHBDJ EIEAW GEXNN BMBDD JGKXL
  TDYGH MBWUB KBNGY BNZBW BRRBL
  YBDJB RBZCB RGEXH ARDJG RGZTD
  GHZGN GRLBY BNRXT DMGHX DGDJB
  OMBNB ZBRSV

Amit tudunk róla:

-         magyar szöveg, de csak az angol ABC 26 karakterér használja

-         nincsenek benne szóközök

-         monoalfabetikus rejtjelzéssel készült

Maga az eljárás magyar nyelvű ismertetése Láng Benedek A Rohonci kód című könyvének függelékében található magyarul. Az angol nyelvű leírást pedig a Basic Cryptanalysis (Field manual 34-40-2) című kódfejtő kézikönyvben található a 4-32 oldaltól.

Szóval, fogjuk a szöveget, és megvizsgáljuk, milyen karakterek fordulnak elő egy adott karakter előtt és után. Ha nem csak vizsgáljuk, hanem fel is írjuk, (sőt még azt is feljegyezzük, hányszor fordulnak elő), akkor az alábbi táblázathoz jutunk:


Gyak  :  4 26  1 12  9 21  9  2  5  2  7  5  8  1  2 12  1  3  3  1  5  8  8  5
Szomsz:  7 15  2 11 10 15  9  2  4  3  7  6  7  2  4  9  2  4  3  1  5 11  7  6
         A  B  C  D  E  G  H  I  J  K  L  M  N  O  Q  R  S  T  U  V  W  X  Y  Z
        -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- --
        RG EY ZB NX MB HM IG -H DE GX EB GE BD BM EA BA RV LD WB S- BU DH BB NB
        QY YR    HG BL AR XD EE DG BB GE BB XN    GX GB    ZD WG    XU YL GX BC
        EW RW    BJ LG DL GH    DB    GG HB NB       GB    XD WB    AG QW AG GT
        HR UE    BD LQ EL HG    DG    XE DG BG       BR             BU EN EG HG
           LN    DJ GY LH BB    DB    XT OB BZ       RB             BB KL DG BB
           RH    TY JI HY GM             BY GG       BB                EH GB   
           HD    BJ IA YE XA             RB BR       BG                RT LB   
           NM    RJ GX YQ GZ                BB       AD                HD BB   
           MD    TG GX UR GX                         GG                         
           MW    TM    WE                            GL                         
           UK    XG    JK                            NX                         
           KN    GJ    YH                            BS                         
           YN          NY                                                       
           ZW          RE                                                       
           WR          JR                                                       
           RL          RZ                                                       
           YD          DH                                                       
           JR          ZN                                                       
           RZ          NR                                                       
           CR          MH                                                       
           LY          DD                                                       
           YN                                                                   
           JO                                                                   
           MN                                                                   
           NZ                                                                   
           ZR

Ebből a táblázatból kiderül például, hogy az A betű 4-szer fordul elő a szövegben, és 7 szomszédja (R,G,Q,Y,E,W,H) van. Azt már az elején tudtuk, hogy szóközökkel nem kell számolni, ezért az I betűnél és a V betűnél feltűnik egy jel, ami azt mutatja, hogy előtte illetve utána nincs karakter. Ha nem tudjuk előre, hogy a szóközöket benne hagyták-e a szövegben, vagy nem, akkor az elemzés után a leggyakoribb karaktert helyettesítsük szóközzel a rejtjelzett szövegben, és az előtűnő karaktercsoportok megmutatják, hogy jól tippeltünk-e. Ha túl sok egyedül álló betű, túl hosszú szavak, illetve több szóköz található egymás után, lehetséges, hogy rossz nyomon járunk. Amennyiben nincs szignifikáns eredmény (mint jelen esetben a B és a G esetében), tévedtünk a monoalfabetikus rejtjellel kapcsolatban.

Ha megvizsgáljuk a B és a G rejtjeleket, látható, hogy igen gyakoriak, és sok szomszédjuk van. A felhasznált 24 karakterből (az F és a P nem lett használva) 15 - 15 másik mellett fordulnak elő. Ezért ezek biztosan magánhangzók lesznek.

Készítsünk két kis táblázatot:


┌─────────────┐       ┌─────────────┐
│ Magánhangzók│       │Mássalhangzók│
├─────────────┤       ├─────────────┤
│             │       │             │
├─────┬─┬─────┤       ├─────┬─┬─────┤
│     │ │     │       │     │ │     │
├─────┼─┼─────┤       ├─────┼─┼─────┤
│     │ │     │       │     │ │     │
└─────┴─┴─────┘       └─────┴─┴─────┘

A magánhangzókhoz írjuk be a B és a G rejtjeleket, alájuk pedig vezessük, hogy melyik szomszédja hányszor fordult elő előtte, illetve utána.

Így fog kinézni:


┌──────────────────────┐
│     Magánhangzók     │
├──────────────────────┤
│          B, G        │
├─────────┬─┬──────────┤
│      II │E│ IIII     │
├─────────┼─┼──────────┤
IIII II │Y│ IIII     │
├─────────┼─┼──────────┤
│  IIII I │R│ IIII III │
├─────────┼─┼──────────┤
│      II │W│ III      │
├─────────┼─┼──────────┤
│     III │U│          │
├─────────┼─┼──────────┤
│     III │L│ III      │
├─────────┼─┼──────────┤
│    IIII │N│ IIII I   │
├─────────┼─┼──────────┤
│     III │H│ IIII     │
├─────────┼─┼──────────┤
│     III │D│ IIII     │
├─────────┼─┼──────────┤
│    IIII │M│ II       │
├─────────┼─┼──────────┤
│       I │K│ II       │
├─────────┼─┼──────────┤
│     III │Z│ III      │
├─────────┼─┼──────────┤
│    IIII │J│          │
├─────────┼─┼──────────┤
│       I │C│          │
├─────────┼─┼──────────┤
│         │O│ I        │
├─────────┼─┼──────────┤
│       I │A│          │
├─────────┼─┼──────────┤
│         │Q│ I        │
└─────────┴─┴──────────┘

Máris látszik, hogy a két vizsgált karakter nagyon gyakran fordul elő az Y és az R szomszédságában. Ezek valószínűleg mássalhangzók lesznek. A mássalhangzó táblázatunk még üres, kezdjük el azt is töltögetni. A vizsgálódást kezdjük a legritkábban előforduló karakterekkel. Ezek majdnem biztosan mássalhangzók. Vegyük először azokat, melyek csak egyszer fordulnak elő a szövegben. Ezek a C, O, S, V betűk. Írjuk be őket a mássalhangzó táblázatba, majd egészítsük ki azokkal, melyek kétszer, háromszor, vagy négyszer fordulnak elő.


┌───────────────────┐
│   Mássalhangzók   │
├───────────────────┤
│C,O,S,V,I,K,Q,T,U,A│
├────────┬─┬────────┤
│     II │Z│        │
├────────┼─┼────────┤
│     II │B│ IIII   │
├────────┼─┼────────┤
│        │M│ I      │
├────────┼─┼────────┤
│      I │S│        │
├────────┼─┼────────┤
│        │V│ I      │
├────────┼─┼────────┤
│      I │H│ I      │
├────────┼─┼────────┤
│    III │E│ I      │
├────────┼─┼────────┤
│        │A│ I      │
├────────┼─┼────────┤
│     II │G│ II     │
├────────┼─┼────────┤
│      I │X│ II     │
├────────┼─┼────────┤
│      I │L│        │
├────────┼─┼────────┤
│        │D│ III    │
├────────┼─┼────────┤
│    III │W│ I      │
├────────┼─┼────────┤
│     II │R│ I      │
├────────┼─┼────────┤
│      I │Q│        │
├────────┼─┼────────┤
│        │Y│ I      │
└────────┴─┴────────┘

Miután kitöltöttük a mássalhangzó táblázatot, láthatjuk, hogy a két feltételezett mássalhangzó (Y, R) a 12 feltételezett mássalhangzó mellett egyszer, illetve háromszor fordul elő. Tehát valószínűleg szintén mássalhangzók lesznek. Egészítsük ki velük a mássalhangzó táblázatot.


┌─────────────────────────────┐
│        Mássalhangzók        │
├─────────────────────────────┤
│   C,O,S,V,I,K,Q,T,U,A R,Y   │
├─────────────┬─┬─────────────┤
│          II │Z│             │
├─────────────┼─┼─────────────┤
│   IIII IIII │B│ IIII IIII II│
├─────────────┼─┼─────────────┤
│             │M│ I           │
├─────────────┼─┼─────────────┤
│           I │S│ I           │
├─────────────┼─┼─────────────┤
│             │V│ I           │
├─────────────┼─┼─────────────┤
│           I │H│ I           │
├─────────────┼─┼─────────────┤
│        IIII │E│ I           │
├─────────────┼─┼─────────────┤
│          II │A│ II          │
├─────────────┼─┼─────────────┤
│    III IIII │G│ IIII II     │
├─────────────┼─┼─────────────┤
│           I │X│ IIII        │
├─────────────┼─┼─────────────┤
│          II │L│ I           │
├─────────────┼─┼─────────────┤
│           I │D│ IIII        │
├─────────────┼─┼─────────────┤
│         III │W│ I           │
├─────────────┼─┼─────────────┤
│         III │R│ II          │
├─────────────┼─┼─────────────┤
│           I │Q│             │
├─────────────┼─┼─────────────┤
│             │Y│ I           │
├─────────────┼─┼─────────────┤
│           I │N│             │
└─────────────┴─┴─────────────┘

Érdekes dolgot figyelhetünk meg a J karakter oszlopában. Csak D után következik, és többnyire G illetve B (tehát magánhangzó) következik utána. Vizsgáljuk most ennek fényében a D karaktert. Azt észrevehetjük, hogy kettős betű, mert előfordul saját maga mellett. (Ez abból látszik, hogy saját oszlopában is szerepel). A B és G után a leggyakoribb, magánhangzók mellett elég szimmetrikusan szerepel, míg mássalhangzó leginkább utána szerepelnek. Vegyük szemügyre az oszlopából azt a részt, ahol a B van előtte, és saját maga követi. Ez a feladványban így szerepel …..BDD…… Keressük ki. A harmadik sor vége felé találjuk. BHBDJ EIEAW GEXNN BMBDD JGKXL .Azt feltételezzük, hogy a B magánhangzó. Ebben az esetben a D biztosan mássalhangzó lesz. Kettős mássalhangzó után jön, az a bizonyos J ami mindig D után van, majd a G ami szintén magánhangzónak tippelünk. Nézzük meg a sor elejét. Ott is találunk egy DJ kettőst, és megint a magánhangzó jelölt B után. Mindezekből az következtethető ki, hogy ha B magánhangzó, akkor D mint kettős mássalhangzó szerepel, és a J y lehet. Vegyük fel tehát a D-t is a mássalhangzó táblázatba. Ha jól megnézzük a táblázatainkat, kitűnik, hogy a mássalhangzó jelöltek mellett nagy számban feltűnik az X karakter, míg a magánhangzók mellett egyszer sem. Feltételezhetően ez is magánhangzó. Írjuk be a táblázatába, a szomszédjaival együtt. Az N karakter oszlopában ismét feltűnik, hogy egy kettős betűről van szó. Mivel leginkább ez is a B és G (mint feltételezett) magánhangzók mellett fordul elő, sőt a frissen feltételezett X és B között is feltűnik valószínű, hogy ez is mássalhangzó lesz. Ugyan ez megfigyelhető a H karakternél, a második sorban kettő G karakter között duplázódik. Most már van elég sok hangzó tippünk, térjünk vissza kicsit a szöveghez. Vegyük elő, és húzgáljuk alá benne a magánhangzó jelölteket:

IHGME BYBRA GRBWU BELBN DXHDG

LEGLG HHGYX LEQAY GEYGQ XWUGR

BHBDJ EIEAW GEXNN BMBDD JGKXL

TDYGH MBWUB KBNGY BNZBW BRRBL

YBDJB RBZCB RGEXH ARDJG RGZTD

GHZGN GRLBY BNRXT DMGHX DGDJB

OMBNB ZBRSV

Ha jól megnézzük az aláhúzott betűk képét, kitűnik, hogy a második sor közepén van egy nagyobb rész, amiben nincs aláhúzott betű. Találunk ilyet a harmadik sor elején, és az ötödik sor vége felé is. Ennyi mássalhangzó egy kupacban biztos nem lenne, tehát itt megbújhatnak még magánhangzók. A harmadik sorban, a már korábban felfedezett DJ kettős után találunk egy E betűt. Nézzük meg a szomszédjait. Sűrűbben fordul elő magánhangzó mellett, sőt kétszer konkrétan két magánhangzónak jelölt betű (G, X) között találjuk. Ezért bejelölhetjük mássalhangzónak. Ha ez mássalhangzó, akkor viszont az I magánhangzó lesz. Igaz, az elemzés elején, a ritka előfordulása miatt ezt felvettük a mássalhangzók közé, de ezen most változtatunk. Ha most ismét megnézzük a harmadik sort, és aláhúzgáljuk a magánhangzó jelölteket, BHBDJ EIEAW GEXNN BMBDD JGKXL Az A betű gyanús. Ezt is mássalhangzónak jelöltük korábban, de ha megnézzük a magánhangzó táblázatot, kitűnik, hogy a 4 előfordulása és 7 szomszédja mellett, mindössze 1 magánhangzó fordul elő, míg mássalhangzó 6. Tehát ez is lehet magánhangzó. Ezzel elméletileg azonosítottuk is a magánhangzókat.

Hogy kiderüljön, fejtsük meg a titkosírást…

 

2 komment

A bejegyzés trackback címe:

https://kodblog.blog.hu/api/trackback/id/tr474200653

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

süti beállítások módosítása