New York Times digitalizuje archív fotografií. Pomáhá mu v tom Google

New York Times digitalizuje archív fotografií. Pomáhá mu v tom Google

New York Times má v podzemním archivu, který nazývá „márnice“ pět až sedm milionů fotografií z konce 19. století. Ty jsou uloženy ve složkách, které jsou ještě uloženy v kartotékách a vyhledávat v nich je tak velice obtížné. Proto přišla na řadu digitalizace, se kterou známému deníku pomáhá Google.

Díky jeho strojnímu učení a cloudovým technologiím tak budou moci být všechny snímky uloženy na cloudovém úložišti, přičemž vyhledávání mezi nimi bude maximálně jednoduché – bude stačit zadat klíčová slova. O detekování objektů a textu se postará duo nástrojů Cloud Vision a Cloud Natural Language. New York Times k tomuto kroku přistoupil také proto, že v roce 2015 bylo v důsledku prasklého vodovodního potrubí zničeno nemalé množství záznamů.

CTO New York Times Nick Rockwell k celé digitalizaci uvedl: „Archiv New York Times je neocenitelnou kronikou nejen deníku, ale mnoha událostí, které formovaly moderní svět“. Dodává, že nad digitalizací uvažovali již po dlouhá léta, ale teprve Google nyní přišel s technologií, se kterou bude celý proces nejjednodušší a nejoptimálnější.

Veškeré fotografie tak budou na cloud ukládány ve vysokém rozlišení. O to se postará Google Kubernetes Engine, vkládání metadat snímkům pak bude probíhat skrze software PostgreSQL v kombinaci s nástroji ExifTool a ImageMagick.

Určitě si přečtěte

Články odjinud