PHP min. 5.6.8MySQL min. 5.1Apache min. 2.0
GitHub
Přidejte kódy
PHP-Fusion 9 Jádro
v9.0
Český překlad
Pravidelně aktualizovaný
Demo
Testovat PHP-Fusion

Technologie

Informace jako na dlani

V dnešní době jsou nejcennějším a nejméně dostatkovým zbožím dvě komodity – informace a čas. Přitom díky digitalizaci a zejména mocnému internetu máme přístup doslova k neuvěřitelnému množství dat. Jen na servery YouTube přibude každou hodinu v průměru 100 hodin videa a Google se musí každou vteřinu vypořádat s více než 40 000 vyhledávacími dotazy. Navzdory snadné dostupnosti informací (nebo možná právě kvůli ní) žízeň lidstva po dalších stále roste. Do digitální formy se proto předělávají i historické dokumenty – včetně středověkých archiválií či záznamů z katastru nemovitostí – zahrnující desítky let staré materiály.


V dnešní době jsou nejcennějším a nejméně dostatkovým zbožím dvě komodity – informace a čas. Přitom díky digitalizaci a zejména mocnému internetu máme přístup doslova k neuvěřitelnému množství dat. Jen na servery YouTube přibude každou hodinu v průměru 100 hodin videa a Google se musí každou vteřinu vypořádat s více než 40 000 vyhledávacími dotazy. Navzdory snadné dostupnosti informací (nebo možná právě kvůli ní) žízeň lidstva po dalších stále roste. Do digitální formy se proto předělávají i historické dokumenty – včetně středověkých archiválií či záznamů z katastru nemovitostí – zahrnující desítky let staré materiály.

Hodně informací, málo času
Stále větší množství informací vyžaduje ale i stále více času k vyhledání požadovaných údajů. Času na procházení nekonečných sérií digitalizovaných dokumentů se však dostává málokomu, a proto na řadu přicházejí nezbytné nástroje, které umožňují efektivní a přesné vyhledávání požadovaných informací v milionech naskenovaných stránek. Tvorbou takovýchto řešení se zabývají i vývojáři společnosti Siemens, kteří představili program umožňující bleskové vyhledávání v rozsáhlých digitalizovaných souborech, aniž by bylo nutné jejich otevření.

Tisíce stran nejsou překážkou
Program byl původně určen pro snazší orientaci právě v datech z katastrů nemovitostí. Protože se jedná až o několik desítek let staré dokumenty, psané zpravidla na psacích strojích, v nichž bývají často dopisovány ještě různé úpravy, vyžadoval program značně robustní algoritmy, které jsou schopny i za takto nepřívětivých podmínek správně identifikovat vyhledávána hesla. Vývojáři následně program upravili, aby mohl sloužit ke snazší orientaci i v jiných typech textových materiálů, jako je například dokumentace k výběrovým řízením.

Tyto typy dokumentů mívají často přes tisíc stránek a mohou navíc obsahovat stejný druh informací i vícekrát v závislosti na tom, jak se dodatečně upravovalo zadání projektu. Vyhledávání proto funguje tak, že automaticky zobrazuje i změny, ke kterým v souvislosti s hledaným tématem došlo ve starších verzích dokumentu.

Sémantika, základ inteligentního hledání
Cílem vývojářů je naučit software základům sémantiky a umožnit mu automatické vyhledávání příbuzných témat ve starších dokumentech. Uživatel by tak měl prakticky ihned k dispozici veškeré důležité i potenciálně zajímavé informace s podobnou tématikou bez časově náročné rešerše. V budoucnu by se pak podobné programy využívající znalosti sémantiky mohly rozšířit i do dalších sfér, jako je třeba právo či medicína. Vyhledávání judikatur nebo diagnóz vzácných onemocnění by pak bylo doslova otázkou jen pár minut.



Připravil: rjancar
PC-politika.cz



22.04.2015 19:07 263 0 komentářů

0 komentářů

Zanechat komentář

Přihlaste se, abyste mohli zveřejnit komentář.
  • Žádné komentáře byly zveřejněny.
Nejnovější témata fóra
  Vlákno Zobrazení Odpovědi Poslední příspěvek
obrázky v news
v PHP - Fusion 9.0.3
25 0 Balin50
21-05-2018 12:12
Gist
v Administrace obsahu
68 2 Kvido
19-05-2018 07:12
Token
v PHP - Fusion 9.0.3
77 2 Balin50
18-05-2018 12:52
Chyba - DatabaseSetup.inc
v PHP - Fusion 9.0.3
61 3 RobiNN
17-05-2018 17:46
tagy vo fóre
v PHP - Fusion 9.0.3
51 0 Balin50
16-05-2018 19:42
Code v news [Vyřešeno]
v PHP - Fusion 9.0.3
93 5 RobiNN
16-05-2018 18:52