TEKNILLINEN KORKEAKOULU Tietotekniikan osasto, Informaatiotekniikan laboratorio Leila Koivisto, puh. 451 3267, fax 451 3277 2.12.2003 VÄITÖSTIEDOTE Väittelijä Ella Bingham, diplomi-insinööri, tutkija, syntynyt Loimaalla 1973 Väitöksen ajankohta Perjantai 12. joulukuuta klo 12 Paikka Teknillinen korkeakoulu, Tietotekniikan talo, sali T2 Vastaväittäjä Tohtori Mark Plumbley, Queen Mary University of London, Iso-Britannia Valvoja Akatemiaprofessori Erkki Oja, Teknillinen korkeakoulu Väitöskirjan nimi Advances in Independent Component Analysis with Applications to Data Mining Riippumattomien komponenttien analyysin laajennuksia ja sovelluksia tiedon louhintaan Väitöskirjan ala Tietotekniikka Väitöskirjan sisältö Väitöstutkimuksessa on kehitetty tehokkaita matemaattisia menetelmiä suurten ja moniulotteisten havaintoaineistojen (datan) automaattiseen analysointiin. Näillä menetelmillä voidaan osaltaan estää havaintoaineiston käyttäjää hukkumasta informaatiotulvaan. Data sisältää usein piileviä rakenteita ja säännönmukaisuuksia, joita käyttäen se voidaan esittää yksinkertaisemmassa ja selkeämmässä muodossa. Esimerkiksi iso tekstiaineisto saattaa sisältää useaa eri aihetta, jolloin aineiston sisältö voidaan tiivistää luetteloksi aiheista, eikä käyttäjän tarvitse lukea koko tekstiaineistoa läpi saadakseen yleiskuvan aineiston sisällöstä. Väitöskirjassa tärkeimpänä datan analysointimenetelmänä on riippumattomien komponenttien analyysi. Tässä menetelmässä havaintoaineistosta pyritään etsimään tilastollisesti riippumattomia, piileviä tekijöitä, joiden yhteisvaikutuksena havaittu data on syntynyt, ja joiden avulla datan rakennetta voidaan kuvailla. Riippumattomien komponenttien analyysin menetelmää laajennetaan ja sovelletaan väitöstyössä eri tavoin, joista mainittakoon kaksi: Kompleksiarvoisille muuttujille kehitetään oma algoritmi, josta on hyötyä matkapuhelinsignaalien käsittelyssä. Useaa eri päällekäistä keskustelua sisältävä ja ajan myötä muuttuva tekstiaineisto analysoidaan ja eri keskustelunaiheet erotellaan toisistaan automaattisesti. Lisäksi väitöskirjassa esitellään kaksi algoritmia, joilla binääriarvoisen datan piilevä rakenne saadaan selville. Moniulotteisen eli monimuuttujaisen datan analysoinnissa on piilevän rakenteen löytämisen lisäksi toinen, osittain päällekäinen tavoite: pienentää muuttujien lukumäärää niin, ettei oleellista tietoa katoa. Väitöskirjassa esitetään tuloksia niinkutsutulle satunnaisprojektio-menetelmälle, joka on laskennallisesti kevyt ja joka sopii myös esikäsittelymenetelmäksi riippumattomien komponenttien analyysille. Väittelijän yhteystiedot Tietotekniikan osasto, Informaatiotekniikan laboratorio Konemiehentie 2, PL 5400, 02015 TKK Puh: 050 3552 553 Sähköposti: ella@iki.fi