PeopleGator, který bude umožňovat vyhledat osoby podle obličeje, bude založen na některé ze současných metod pro identifikaci osob podle obličeje. Tyto metody využívající konvoluční neuronové sítě pro extrakci vektoru čísel (embedding), který reprezentuje identitu osoby na fotografii. Podobné osoby je pak možné vyhledávat porovnáváním těchto vektorů (například pomocí euklidovské vzdálenosti). Tento přistup je v současné době dobře zvládnutý a je možné využít i hotové programové balíčky implementující trénování těchto neuronových sítí. Vhodné existující datové sady fotografií převedeme automaticky do podoby, která odpovídá vytištěným a poté digitalizovaným fotografiím. Pro tyto úpravy použijeme dva postupy. Vytvoříme ručně definovaný řetězec simulující proces tisku a digitalizace. Také použijeme některou z metod pro překlad obrázku na obrázek.
AnnoPage, který bude umožňovat vyhledávání netextové části stránek textovými dotazy, vyžaduje několik technických prvků, které to umožní. Ve vývoji budeme co nejvíce využívat existující open source software i existujících datových sad. Základem je lokalizace netextových částí stránek. Pro tento účel rozšíříme současné zpracování rozložení stránek v balíčku PERO-OCR, který je založen na segmentačních konvolučních sítích.
Kramerius Orbis Pictus bude koncipován jako webová aplikace komunikující přes API jak s jedním nebo více digitálními knihovnami Kramerius, tak i komunikaci s Databází osob včetně funkcionality jejich vyhledávání podle grafické předlohy a indexem díky AnnoPage identifikovaných grafických elementů. Tento index bude v rámci poloprovozu Česká digitální knihovna – Orbis Pictus přidružen ke stávajícímu indexu České digitální knihovny.