Főoldal Módszertan
Módszertan — hogyan gyűjtjük és ellenőrizzük az adatokat.
Ez az oldal kerekítések nélkül leírja, milyen forrásokat használunk, milyen gyakran frissítünk, milyen ellenőrzéseket alkalmazunk, mit nem tudunk garantálni, és hogyan reagálunk a jelzésekre. Ha hibát találsz vagy elveszettnek érzed magad, írj a contact@hartafarmacii.ro címre.
1. Adatforrások
1.1 Gyógyszertárak helyszínei
Az elsődleges forrás az OpenStreetMap (OSM), amelyet az
Overpass API-n keresztül
kérdezünk le, az amenity=pharmacy szűrővel Románia közigazgatási
határain belül. Az OSM-adatok az
ODbL
licenc alatt érhetők el, ami megengedi a továbbterjesztést és felhasználást
hivatkozással — ezt a hivatkozást minden oldal láblécében és a nyilvános
GeoJSON végpontban kifejezetten feltüntetjük.
Az OSM-adatokat a nagy hálózatok (Catena, Dr. Max, Help Net, Dona, Farmacia Tei, Mattca, Spring Farma) nyilvános üzletkereső oldalaival egészítjük ki — ezek másodlagos forrásként szolgálnak nyitvatartáshoz, telefonszámhoz és hálózat-azonosításhoz. Gazdagításra használjuk őket, nem az OSM-koordináták helyettesítésére.
1.2 Termékárak
Az árak az online gyógyszertárak nyilvános weboldalairól
származnak. Az előnyben részesített módszer a JSON-LD
schema.org/Product blokkok elemzése — egy strukturált formátum,
amelyet a kereskedők többsége közzétesz a Google Shopping indexálás
megkönnyítésére. Ahol a JSON-LD nem elérhető, oldalspecifikus HTML-elemzőket
használunk (egyedi CSS-szelektorokat).
Hálózatok, amelyekből jelenleg árakat gyűjtünk: Catena, Dr. Max (Richter almárkával), Farmacia Tei, Help Net, Dona (amikor nem blokkolja a crawlert), Mattca, Spring Farma, plusz független online gyógyszertárak (Minifarm, Farmacia Dav, Farmacia Ardealul). A tényleges lefedettség idővel változik, a nyilvános feedek elérhetőségétől függően.
1.3 Rx-referenciák (CANAMED)
A vényköteles gyógyszerekhez a CANAMED listát használjuk referenciaként — az Egészségügyi Minisztérium által jóváhagyott maximális kiskereskedelmi árat, amelyet havonta tesz közzé a minisztérium honlapján. A CANAMED nem értékesítési ár — az a plafon, amely felett a gyógyszertár nem értékesíthet. Szigorúan viszonyítási alapként mutatjuk meg. A listát havonta importáljuk (systemd timer a VPS-en).
2. Frissítési gyakoriság
- Helyszínek — naponta lekérve OSM-ből, de csak akkor, ha diff alapján változás detektálható. A helyszínek nagyon stabilak (a gyógyszertárak nem költöznek naponta).
- Nyitvatartás — manuálisan frissítve jelzésre, vagy ha a hálózat frissítést tesz közzé az üzletkeresőjén. A 0–24-es gyógyszertárakhoz külön oldalunk van, amely egyértelműen jelöli, mikor nem tudjuk megerősíteni a 0–24 állapotot.
- Árak — hálózatonként változó: egyes scraperek naponta futnak (a könnyű JSON-LD-vel rendelkezők, amelyek nem blokkolnak agresszíven), mások hetente (Catena/Tei listázó oldalakon). Az utolsó frissítés időbélyege az adatbázisban ajánlatonként rögzítve van, és megjelenik a termékoldalon.
- CANAMED — havonta importálva.
3. Adatminőség
3.1 Termék ↔ ár megfeleltetés
A gyógyszerár-összehasonlító legnehezebb része a matching: biztosan eldönteni, hogy a „Nurofen 200mg 24 db-os doboz" az egyik oldalon ugyanaz a termék, mint a „NUROFEN 200 MG 24 FILMTABL." a másikon. Három jelet használunk bizalmi sorrendben:
- GTIN / EAN-13 kód — ha jelen van a JSON-LD-ben, ez determinisztikus megfelelés.
- INN (nemzetközi szabadnév) + hatáserősség + gyógyszerforma + kiszerelés — másodlagos illesztésként.
- Normalizált márkanév + kiszerelés — visszaeséshez, ha az első kettő hiányzik.
Amikor két forrás nem ért egyet a kiszerelésben (pl. egyik szerint „24 tabl.", másik szerint „24 kapszula"), ütközés-flaget állítunk: az ajánlatok külön maradnak manuális felülvizsgálatig. Inkább vállalunk hamis negatívot (két duplikált bejegyzés), mint hamis pozitívot (rossz ár rossz termék alatt).
3.2 Automatikus ellenőrzések
- Ár ésszerű tartományban (RON 0,10 – 5.000) — ezen kívül az ár gyanús, nem jelenítjük meg.
- Több forrásból érkező azonos árak detektálása → általában upstream hibára utal, ezt megjelöljük.
- Heurisztikák annak észlelésére, hogy egy oldal struktúrát váltott (hirtelen 0%-os match-arány) → riasztás.
4. Nyíltan kijelentett korlátok
A megjelenített ár eltérhet a fizikai gyógyszertári ártól. Az általunk gyűjtött árak a hálózatok online áruházaiból származnak — ezek nincsenek mindig szinkronban a fizikai polcán látható árral. Vásárláshoz ellenőrizz közvetlenül a gyógyszertárban.
- A lefedettség nem 100%-os. Egyes hálózatok (jelenleg Dona, Ardealul) blokkolják a crawlereket, vagy Cloudflare challenge-eket kérnek, ami csökkenti a lefedettséget. Láthatóan jelöljük, ha nincs adatunk egy hálózatra egy adott termékre.
- Támogatott Rx-árak — nem mutatjuk meg. A támogatott gyógyszer ténylegesen kifizetett ára a recept státuszától (50%, 90% támogatás, ingyenes egyes betegségekre), a felírt INN-től és a kiadó gyógyszertártól függ. Ezek nem fix nyilvános árak — egyetlen szám megjelenítése félrevezető lenne. A CANAMED az egyetlen abszolút nyilvános viszonyítási alap, és ezt mutatjuk meg.
- Hiányos adatok kis gyógyszertáraknál. A független, OSM-ben nem szereplő, üzletkereső weboldal nélküli gyógyszertárakhoz hiányozhatnak az adatok.
- Megjelenési késleltetés. Egy új gyógyszertár az indexünkben azután jelenik meg, hogy bekerül az OSM-be — általában néhány hét. Jelzésre fel tudjuk gyorsítani.
5. Logópolitika
A hálózati logókat leíró fair-use keretében használjuk — márkaazonosításhoz összehasonlító listákban és hálózati oldalakon. Nem sugallunk endorsementet, partnerséget vagy felhatalmazást. Ha egy hálózat takedown-t kér a contact@hartafarmacii.ro címen, 48 órán belül eltávolítjuk a logót, és semleges szöveges helyettesítővel pótoljuk.
6. AI-politika
A HartaFarmacii AI-t kizárólag asszisztáló pipeline-okban használ, nem automatikusan generált tartalom felülvizsgálat nélküli közzétételéhez. Konkrétan:
- A szerkesztői cikkek (betegútmutatók, tünet- és betegségoldalak) a hivatkozott nyilvános források (ANMDMR, EMA, betegtájékoztatók) manuális kurátorálásával készülnek. Egy nyelvi modell asszisztálhatja őket a folyékonyság érdekében, de minden orvosi tényt az elsődleges forrásban ellenőrzünk a közzététel előtt.
- Nincs tömegesen generált, LLM-mel „spinnelt" SEO-tartalom felülvizsgálat nélkül publikálva.
- A Common Crawl / scrape-elt oldalakat nem tesszük újra közzé a HartaFarmacii-n — az adatokat csak a megjelenített árak kiszámítására használjuk.
7. Összeférhetetlenség
Kifejezetten kijelentve: nincs összeférhetetlenség. Nem állunk kapcsolatban, nem kapunk értékesítési jutalékot, és nincsenek szerződéseink a felsorolt hálózatokkal. A bevétel 100%-ban:
- kontextus alapú Google AdSense (web) és Google AdMob (iOS) hirdetésekből, csak hozzájárulás után megjelenítve;
- iOS „Premium Lifetime" alkalmazáson belüli vásárlásból 4,99 RON-ért, egyszeri fizetés, amely kikapcsolja a hirdetéseket.
Egyetlen bevételi forrás sem befolyásolja az árlista sorrendjét, vagy hogy melyik cikk jelenik meg a webhelyen. Ha gyanús összeférhetetlenséget észlelsz, írj nekünk, és tisztázzuk.
8. Hibajelzés
Egyetlen csatorna: contact@hartafarmacii.ro →
- Sürgős javításoknál (rossz ár indexelt oldalon) — válasz 24-48 órán belül.
- Nem sürgős javításoknál (helytelen nyitvatartás, érvénytelen telefon, rossz hálózat) — legfeljebb 7 munkanapon belül javítva.
- Logó / gyógyszertár takedown — 48 óra.
Belső folyamat: megkapjuk az e-mailt → 24 órán belül megerősítjük → ellenőrizzük a forrást (általában visszatérünk az eredeti nyilvános forráshoz) → alkalmazzuk a javítást az adatbázisban → válaszlevélben megerősítjük az eredményt.
9. Verziók és életciklus
Ezt a módszertani oldalt 2026-05-01-én vizsgáltuk át utoljára, és frissítjük, valahányszor új forrást adunk hozzá, frissítési gyakoriságot változtatunk, vagy új korlátot fedezünk fel, amelyet ki akarunk jelenteni. A teljes kód-repository privát, de kérésre auditra nyitott.
Olvasd tovább: Szerkesztőség · Rólunk · Feltételek · Adatvédelem.