Tágabb értelemben véve a témám az aktív tanulás (active learning, adaptive sensing). Ez egy sok mindent magába foglaló elnevezés, bennünket főként az elméleti statisztikai vonatkozásai érdekelnek. Röviden leírom ez mit tesz.
A matematikai statisztika alapfelállása az, hogy valamilyen ismeretlen jelenségről, rendszerről vagy mennyiségről kísérletezéssel próbálunk információt szerezni. Ez azt jelenti, hogy megfigyeljük a minket érdeklő objektumot, de a megfigyeléseinket zaj terheli (mérési hiba, zavaró környezeti tényezők hatásai). A fő kérdés az, hogy mennyire hatékonyan tudunk következtetni a valóságra ezekből a csak bizonyos mértékig megbízható megfigyelésekből.
Alap esetben a kísérleteket előre megtervezik, és nincs mód a kísérlet paramétereinek megváltoztatására miután a mintavételezés elkezdődik. A kérdés ekkor az, hogy mekkora mintát kell gyűjteni ahhoz, hogy a vizsgált "valóságot" jó eséllyel megismerjük.
Aktív tanulás esetében azonban módunkban áll a kísérleti paraméterek folyamatos finomhangolására. Így ahogy folyamatosan bővül az ismeretünk a valósággal kapcsolatban, úgy van lehetőségünk olyan kísérletek végzésére, amikkel a lehető legtöbb információt tudjuk begyűjteni. Elvileg ez által gyorsabban meg tudjuk ismerni a vizsgálni kívánt objektumot. Kérdés, hogy segít-e ez nekünk valamit, és ha igen, akkor mennyit?
Például képzeljük el, hogy az alábbi kép az éjszakai égboltról az az objektum, ami minket érdekel.
Ezen a képen szeretnénk a csillagok helyét meghatározni (a képet természetesen nem ismerjük előre). Sajnos ezt nem tudjuk közvetlenül megfigyelni, pusztán zajos formában ami valahogy így néz ki:
Viszont ha elég zajos felvételt gyűjtünk, egy idő után képesek vagyunk rekonstruálni az eredeti képet. A klasszikus tanulási folyamat esetében előre be kell állítani a paramétereket, mielőtt a zajos képeket elkezdjük begyűjteni. Természetesen nem tudunk tetszőlegesen pontosan mérni, hiszen akkor az egész kérdésnek semmi értelme. Képzeljük tehát el, hogy képkockánként meghatározhatjuk a mérési pontosságot, de minél pontosabban akarunk mérni, az annál többe kerül, és van egy összköltség, amit nem haladhatunk meg képenként. Mivel előzetesen gőzünk sincs hol vannak a csillagok, így logikus a kép minden részére azonos hangsúlyt fektetni (azaz azonos pontossággal mérek minden képkockát). Ekkor meghatározható, hogy mennyi felvételt kell készítenünk ahhoz, hogy az eredeti képet nagy pontossággal rekonstruálni tudjuk.
Aktív tanulás esetén módunkban áll a mérések pontosságát folyamatosan finomhangolni, ahogy a felvételeket készítjük. Mivel minket a csillagok helye érdekel, ezért logikus lehet azokra a régiókra koncentrálni jobban, ahol az első néhány kép alapján nagyobb esélyt látunk arra, hogy csillagot találunk. Jó ötlet ez? Segít valamit? Mi az a módszer amivel a lehető legkevesebb felvételre van szükségünk az eredeti kép pontos rekonstruálásához?
Mint kiderült, az aktív tanulás segít (itt jegyzem meg, hogy bár az intuíció azt súgja, hogy az aktív tanulás mindig jobb, valójában számos olyan helyzet van, ahol nem segít), és a legjobb módszer valóban lényegében az amit az előző résznél írtam.
A kérdést tovább lehet vinni egy kicsivel. Mi van akkor, ha a vizsgálni kívánt kép továbbra is nulla (az előző példában fekete) és nem-nulla (az előző példában fehér) értékeket tartalmaz, de a nem-nulla értékek elhelyezkedése valamilyen struktúrát követ. Például blokkokban vannak,
mint egy agyi fMRI-n egy terület periodikus stimulálásánál kapott felvételnél. Vagy egy mátrix részmátrixa,
mint a genetikai vizsgálatokban, ahol azt tapasztaljuk, hogy hasonló gének együtt aktiválódnak bizonyos környezeti behatásra, vagy gyógyszerekre való reakcióként. Vagy egy csillag formájú alakzatok egy hálózatban,
amik például valamilyen anomáliát jeleznek a hálózat pontjaiban. Fel tudjuk-e használni ezekben az esetekben a jel struktúrájáról levő előzetes ismereteinket a gyorsabb tanulás elősegítéséhez? Ehhez hasonló speciális esetekben igen, és tudunk adni egy eljárást, ami a lehető leggyorsabban rekonstruálja az ilyen "képeket".
Röviden ennyi. Sajnos bár az eljárásunk úgy tűnik jól működik még egy halom speciális esetben, az optimalitására általános feltételeket nem sikerült még adni. Azt hittem enélkül nem igazán érdekes a dolog, de úgy néz ki mégis megpróbáljuk publikálni amink van, és majd látjuk mi lesz. Meg hát ezt a nyitott kérdést még a későbbiekben hátha megoldjuk.