Adatkezelő technológiák

Az Adatkezelő technológiák területén dolgozó munkatársaink relációs adatbázis-kezelő rendszerekkel, adattárházakkal, üzleti intelligenciát alkalmazó rendszerekkel foglalkoznak.

Gyakori minta bányászat

Az adatbányászat lényege potenciálisan hasznos, korábban nem ismert, rejtett összefüggések keresése nagy adathalmazokon. A gyakori minta bányászata ennek a komplex feladatnak egy alfeladata, melynek során a nagy adathalmazban különböző gyakran előforduló mintákat (elemhalmazokat, szekvenciákat, esetleg gráfokat) kell megtalálni hatékony módon.

Klaszterezés

A klaszterezés lényege, hogy objektumok egy halmazát csoportokba soroljuk olyan módon, hogy az azonos csoportba kerülő objektumok egy adott hasonlósági mérték mentén hasonlóak, míg a különböző csoportba sorolt objektumok lényegesen különbözőek legyenek.

A klaszterezés lényegében egy nem irányított tanulás, melynek során a rendszer automatikusan képes felismerni az összetartozó és a biztosan nem összetartozó objektumokat.

Webes adatbányászat

Az adatbányászaton belül egy külön terület a webes adatbányászat, ahol az adatok a világhálón találhatóak meg vagy honlapok, vagy azok által tartalmazott dokumentumok, képek formájában, vagy éppen a honlapok felépítése és használata (web logok) során kialakuló nagy adathalmazok formájában.

A webes adatbányászat egyik fő vonulata a web szerverek és/vagy a kliensek által tárolt naplófájlok vizsgálata rejtett információk kinyerésének a céljából. Ez használható például felhasználók azonosítására, csoportosítására, az egyes web oldalak használata során kialakult ismeretek alapján a honlap átstrukturálására stb.

Multidimenziós adat-vizualizáció

A vizualizáció nem már, mint numerikus formában tárolt adatok grafikus formába történő transzformálása és megjelenítése. Két változó közötti kapcsolat megértése egyszerűbb az ember számára, ha azt ki tudjuk rajzolni egy gráfban. Az egyszerű vonal diagram már több száz év óta használatos adatábrázolás céljából. Három elem összefüggése részben megérthető egy kvázi háromdimenziós nézet létrehozásával. Azonban háromnál több változót tartalmazó összefüggések megértése hagyományos technikák használatával már korlátokba ütközik. Az információ vizualizáció egy új irányzat az adatbányászat területén, amelynek célja, hogy használható, többdimenziós megjelenítési technikákat fejlesszen ki.