Különleges magyar fejlesztés hozhatja versenyelőnybe a hazai vállalatokat és intézményeket – a világsajtó monitorozásával. A TranzPress nyelvi kompetenciára és innovatív szoftverfejlesztésre épülő „PressMonitor” elnevezésű szolgáltatásával bárki naponta nyomon követheti a számára fontos témák alakulását, a „Language and Media Intelligence” irányítói szerint: „a világ bármely részén”. Ma már egyre több megbízó – köztük az Európai Parlament is – igénybe veszi ezt a szolgáltatást. Kíváncsiak lettünk ennek a részleteire is, hiszen a pr-tevékenység egyik fontos kutatási eszközéről van szó.

Szalay-Berzeviczy András

Szalay-Berzeviczy András

– Melyek a nyelvi kompetenciára és innovatív szoftverfejlesztésre épülő szolgáltatás sajátosságai?
Szalay-Berzeviczy András
: – A TranzPress magtevékenységét nézve nyelvi szolgáltató, mely szoftverlokalizációt és szakfordítást végez, főleg exportra. Mi a nyelvi piacról érkeztünk a médiafigyelés területére, mert feltűnt, hogy senki nem foglalkozik Magyarországon a nemzetközi, idegen nyelvű sajtó szisztematikus kutatásával. De nemcsak kínálat nem létezett. Öt évvel az EU-s csatlakozásunk után a kereslet is igen lappangó volt. 2009-ben amikor nekilendültünk a PressMonitor fejlesztésének, az volt a célunk: jöjjön létre Magyarországon egy olyan felhőalapú szolgáltatás, mely személyre szabottan képes széles körű, nemzetközi, tradicionális és közösségi médiatartalmat monitorozni és azt intelligens szoftveres eszközökkel elemezni. Több mint 80.000 forrást látunk világszerte, szinte valós időben. Ennek nagyrésze online és közösségi tartalom, de ügyfeleink elérnek a rendszerünkben hazai és külföldi nyomtatott, sőt külföldi rádió és televízió tartalmakat is. Ez természetesen nemcsak szoftverünk és kis létszámú csapatunknak köszönhető, hanem egy sor nemzetközi partnernek is, akik vagy tartalomszolgáltatói, vagy fejlesztői minőségben adnak hozzá a PressMonitor egyedülálló teljesítményéhez.
– Önök azt állítják, hogy „napi szinten nyomon tudják követni a kiválasztott témák alakulását a világ bármely részén.” Igaz ez az arab és a kínai nyelvterületekre is?
Szalay-Berzeviczy András
: – A „Big Data” és a negyedik ipari forradalom korát éljük. A Facebook-on félmillió, a Twitteren kétszázötvenezer poszt jelenik meg percenként, a legkülönbözőbb nyelveken. A világban percenként ötszáz új weboldal üti fel a fejét, és a következő robbanás két éven belül fog megtörténni, amikor az internet.org kezdeményezésére még száz, harmadik világbeli, szegény ország sok-sok milliónyi lakosa csatlakozik a netre és válik a közösségi médiatér aktív résztvevőjévé. Mindeközben – a kezdeti aggodalmak ellenére – a hagyományos világsajtó tartalomgyártása sem apadt el. A print lapok szerkesztőségei csak a nyomtatott példányszámot csökkentették, miközben online jelenlétüket többnyire erősítették. Az exponenciálisan növekvő tartalomgyártás több nyelven történik. Magyarország pedig egy nyitott és exportorientált gazdaság, a globalizált versenytér egy kisméretű, de aktív játékosa. Vállalatainknak – nemzetközi versenyképességük erősítése érdekében – egyre nagyobb szüksége lesz a gyors, érthető és szűrt információkra. Mindebből egyenesen következik, hogy nem elég egy nagyteljesítményű aggregáló és információszűrő berendezést felépíteni. A szoftvert fel is kell készíteni a többnyelvű tartalmak értelmezésére és nyelvi közvetítésére is. A „Media intelligence” szolgáltatásunk gyakorlatilag arról szól, hogy a nemzetközi médiatérből fókuszált információkat nyerjünk ki a kívánt nyelveken. A hazai exportorientált KKV-knak például magyar nyelven, tömörítve van szükségük információkra, új piacokon feltárulkozó lehetőségeikről, míg egy olyan kiemelt ügyfelünknek, mint az Európai Parlament, angolul van szüksége a hazai médiakép részleteire. Multinacionális vállalati ügyfeleink között is vannak, akik angolul kérik a riportokat az idegen nyelvű menedzsment okán. Előfordult már, hogy egzotikus nyelvből „szűrtünk hírértéket”. Jelenleg is van olyan projektünk, melyben a bosnyák és török nyelvű, helyi sajtóból szemlézünk mindennap angol nyelvre. Ez azonban ritkább. Mivel az esetek többségében gazdasági témákat dolgozunk fel, a forrásnyelv legtöbbször az üzleti élet világnyelve, vagyis az angol. Fontos említést tenni még a rendszerbe integrált többnyelvű gépi fordítóról is. A gépi fordítás minősége ugye korlátozott – főleg a magyar nyelv küzd e téren komoly hendikeppel. Ezért helytállóbb a szövegmegértés-támogásnak hívni ezt a folyamatot. A felhasználó a PressMonitor felületén néhány kattintással másodpercek alatt hozzájut egy arab vagy kínai cikk magyar nyelvű nyersfordításához, amiből legalább azt el tudja dönteni, miről szól a cikk, és igényel-e belőle szakszerű fordítást vagy kivonatot.
– Miként lehet „a megbízó személyes preferenciáit” figyelembe venni a közösségi média elemzése során? Milyen nehézségekbe ütköznek ezeken a felületeken, amelyeket le kell küzdeniük?
Szalay-Berzeviczy András
: – Minden projektünk egyedi és személyre szabott. Mindennek kulcsa a jó kulcsszavazás, de ezen túl a keresések számos módon finomhangolhatók; figyelt ország, nyelv, szakterület, stopszólisták és egyéb ügyfélspecifikus szempontok alapján. A közösségi média monitoringnál – nem meglepő módon – a publikusan elérhető kommentek, fórumok bejegyzéseinek hiánytalan és gyors azonosítása jelentik a legnagyobb kihívást. A crawling technikákat azonban többnyire a világ legjobbjaitól vesszük igénybe. Már a kezdet kezdetén az volt az elv, hogy egy kompakt szolgáltatást és szoftvert hozzunk létre, és specialistákat alkalmazzunk egy-egy részterületre, mondván ne akarjunk mindenre saját fejlesztést építeni nulláról. Ahogy az autóipari cégek a gördülőcsapágyakat az arra szakosodott beszállítóktól, vagy ahogy az Apple a processzorokat az arra szakosodott Inteltől vásárolja meg, a keresési technikákat mi is többnyire beszerezzük specialistáktól. Nem versenyzünk a legnagyobb tartalomaggregátorokkal, inkább igénybe vesszük őket. Így ők küzdenek meg az eltérő szerkesztőségi struktúrákkal és robotvédelemmel.
– Milyen módszertant alkalmaznak a szövegbányászat során?
Szalay-Berzeviczy András: – Elemzési céltól függ, hogy szemantikus, azaz szabályalapú vagy statisztikai megközelítésre van szükség. Ahhoz hogy megállapítsuk, hogy például ötszáz hírből, melyből ötven foglalkozik érdemben entitásunkkal, azaz a megfigyelt szervezettel/személlyel, elegendőek a statisztikai, Big Data módszerek. Ahhoz azonban, hogy megmondjuk, hogy egy megjelenés pozitív vagy negatív tónusú, nem árt már komplexebb nyelvi megközelítést alkalmazni, és nemcsak a jelzőket, mellékneveket számolni a szövegben. Itt még sok a teendőnk, és van olyan kvalitatív elemzésünk, amit külső partner integrált szolgáltatása végez a szövegeken óráról órára. Jelenleg napi kb. 3000 db előszűrt médiatartalom közlekedik át a rendszerünkön. Célunk, hogy az ember által már nehezen értelmezhető hírmennyiség szűrését, rendszerezését, analitikáját a lehető legnagyobb mértékben automatizáljuk.
– A nemzetközi médiafigyelő és elemzési szolgáltatás mennyire terjed ki a blogszférára?
Szalay-Berzeviczy András
: – Közösségi médiaszolgáltató partnerünk a Twitter certifikált partnere, így minden tweet-re rálátásunk van. Elérünk minden publikus oldalt és kapcsolódó posztokat a Facebook-on és monitorozzuk a YouTube-ot is. Továbbá csak Magyarországon többezer blogot, fórumot látunk. Ügyfeleink egyre többször kérik a webkettes tartalmak bekapcsolását is a figyelésbe és elemzésbe.
– A közösségi médiafelületek posztjaihoz kapcsolódó komment-folyamatok elemzése bonyolult személyiségi jogi kérdéseket és etikai dilemmákat is felvet. Milyen elveket tartanak szem előtt ilyen megrendelések esetén?
Szalay-Berzeviczy András
: – Az internet egy nyílt közösségi tér. Azért blogolok és kommentelek, hogy olvassák amit írok, nem azért, mert magamba akarom tartani a gondolataim, mintha naplót írnék csendes magányomban. Azok a közösségi portálok pedig, melyeken a felhasználók saját profilokat hoznak létre személyes adataik megadásával azzal a céllal, hogy csak meghatározott köröknek tegyenek közzé adatokat és tartalmakat, nos az ilyen felületek egyre szigorúbban szabályozzák a monitorozásukat. A Facebook például idén áprilistól csak a publikus oldalak indexálását teszi csak lehetővé API-ján keresztül. Az ilyen és hasonló jogi és technikai korlátokat pedig szolgáltatóként értelemszerűen tiszteletben kell tartanunk.