A 3DNET PROGRAMCSOMAG TOVÁBBFEJLESZTÉSE
Kövesdi István
Egis, 1475 Budapest Pf. 100.
A 3DNET Ver. 2.0 program számos QSA/PR módszert és validálási eljárást foglal egységes keretbe az alábbi 4 modulba csoportosítva:
• A molekulákat leíró adatokat számoló rész. Itt jelenleg kb. 10000 különféle deszkriptor számítása történhet. Ezek számított 2D és vagy 3D molekuláris változók, tárolt fiziko–kémiai adatok vagy digitalizált spektrumok is lehetnek.
• QSA/PR módszerek. Általános többváltozós lineáris regresszió, PLS analízis, fókuszált PLS analízis, back-propagation és bayesian neurális hálózatok.
• Validálási módszerek. Reprodukciós, Leave-N-out, leave-one-out, bootstrapping, shuffling eljárások.
• Optimális leíró és QSA/PR modell kiválasztások a programban lévő minden QSA/PR módszerre genetikus vagy a módszertől függő direkt algoritmussal. Az optimalizálás általában bármelyik validálási eljárással történhet.
A 3DNET 2.0 programban a modulok kombinálhatók. Például a többváltozós lineáris regresszió optimalizálása történhet leave-one-out validálással, vagy a neurális hálózati modell optimalizálható a paraméter minimális értékének megadásával az adatreprodukció szerint vagy az előírt maximális számú komponensre végzett PLS analízis leave-N-out validálással is vezérelhető. Ezek a vizsgálatok a nagyszámú deszkriptorok tetszőleges részhalmazára elvégezhetők és a különböző QSA/PR eljárások közül kiválasztható az adatok hibájához és a vizsgált molekulák számához optimális módszer. Az IBM PC platformon (P2 300 MHz) a WIN98 vagy NT alatt futó kisméretű 3DNET program IsisBase SDF formátumban kezeli a molekulák adatait és 2D leírókat tartalmazó QSA/PR esetén óránként kb. 20000 molekulára végzi el az analízist. Az időigényesebben számítható térfogati, felületi leírókból a program molekula adatbázist tud létrehozni kb. 10000 molekula / nap sebességgel.