PHP min. 5.6.8MySQL min. 5.1Apache min. 2.0
PHP-Fusion 9 Jádro
v9.0
Český překlad
Pravidelně aktualizovaný

Technologie

Informace jako na dlani

V dnešní době jsou nejcennějším a nejméně dostatkovým zbožím dvě komodity – informace a čas. Přitom díky digitalizaci a zejména mocnému internetu máme přístup doslova k neuvěřitelnému množství dat. Jen na servery YouTube přibude každou hodinu v průměru 100 hodin videa a Google se musí každou vteřinu vypořádat s více než 40 000 vyhledávacími dotazy. Navzdory snadné dostupnosti informací (nebo možná právě kvůli ní) žízeň lidstva po dalších stále roste. Do digitální formy se proto předělávají i historické dokumenty – včetně středověkých archiválií či záznamů z katastru nemovitostí – zahrnující desítky let staré materiály.


V dnešní době jsou nejcennějším a nejméně dostatkovým zbožím dvě komodity – informace a čas. Přitom díky digitalizaci a zejména mocnému internetu máme přístup doslova k neuvěřitelnému množství dat. Jen na servery YouTube přibude každou hodinu v průměru 100 hodin videa a Google se musí každou vteřinu vypořádat s více než 40 000 vyhledávacími dotazy. Navzdory snadné dostupnosti informací (nebo možná právě kvůli ní) žízeň lidstva po dalších stále roste. Do digitální formy se proto předělávají i historické dokumenty – včetně středověkých archiválií či záznamů z katastru nemovitostí – zahrnující desítky let staré materiály.

Hodně informací, málo času
Stále větší množství informací vyžaduje ale i stále více času k vyhledání požadovaných údajů. Času na procházení nekonečných sérií digitalizovaných dokumentů se však dostává málokomu, a proto na řadu přicházejí nezbytné nástroje, které umožňují efektivní a přesné vyhledávání požadovaných informací v milionech naskenovaných stránek. Tvorbou takovýchto řešení se zabývají i vývojáři společnosti Siemens, kteří představili program umožňující bleskové vyhledávání v rozsáhlých digitalizovaných souborech, aniž by bylo nutné jejich otevření.

Tisíce stran nejsou překážkou
Program byl původně určen pro snazší orientaci právě v datech z katastrů nemovitostí. Protože se jedná až o několik desítek let staré dokumenty, psané zpravidla na psacích strojích, v nichž bývají často dopisovány ještě různé úpravy, vyžadoval program značně robustní algoritmy, které jsou schopny i za takto nepřívětivých podmínek správně identifikovat vyhledávána hesla. Vývojáři následně program upravili, aby mohl sloužit ke snazší orientaci i v jiných typech textových materiálů, jako je například dokumentace k výběrovým řízením.

Tyto typy dokumentů mívají často přes tisíc stránek a mohou navíc obsahovat stejný druh informací i vícekrát v závislosti na tom, jak se dodatečně upravovalo zadání projektu. Vyhledávání proto funguje tak, že automaticky zobrazuje i změny, ke kterým v souvislosti s hledaným tématem došlo ve starších verzích dokumentu.

Sémantika, základ inteligentního hledání
Cílem vývojářů je naučit software základům sémantiky a umožnit mu automatické vyhledávání příbuzných témat ve starších dokumentech. Uživatel by tak měl prakticky ihned k dispozici veškeré důležité i potenciálně zajímavé informace s podobnou tématikou bez časově náročné rešerše. V budoucnu by se pak podobné programy využívající znalosti sémantiky mohly rozšířit i do dalších sfér, jako je třeba právo či medicína. Vyhledávání judikatur nebo diagnóz vzácných onemocnění by pak bylo doslova otázkou jen pár minut.



Připravil: rjancar
PC-politika.cz



22.04.2015 19:07 288 0 komentářů

0 komentářů

Zanechat komentář

Přihlaste se, abyste mohli zveřejnit komentář.
  • Žádné komentáře byly zveřejněny.
Nejnovější témata fóra
  Vlákno Zobrazení Odpovědi Poslední příspěvek
FAQ chyba
v Administrace obsahu
6 0 Balin50
22-09-2018 22:15
Vývoj - ako pokračuje
v PHP-Fusion 9.0.3
73 1 Kvido
18-09-2018 12:59
Blogs na HP [Vyřešeno]
v PHP-Fusion 9.0
89 2 Kvido
15-09-2018 17:12
Tenisový portál [Vyřešeno]
v Obecná diskuse
171 3 jany
08-09-2018 08:06
Prihlásenie [Vyřešeno]
v Administrace systému
152 7 Balin50
05-09-2018 15:36
FAQ formátovanie [Vyřešeno]
v Administrace obsahu
223 8 RobiNN
05-09-2018 15:09
Token [Vyřešeno]
v Administrace systému
164 1 RobiNN
05-09-2018 15:05
Přihlášení
Ještě nejste členem? Klikněte zde a zaregistrujte se.
Shoutbox
Chcete-li odeslat zprávu, musíte se přihlásit.
Kvido
před 18 dny
Jj. Zbytečné moc ne, pač tu u jejich reg. e-mailem nepustím zahraniční, nejčastěji ru., com., org.
RobiNN
před 18 dny
Kvido spammerov musíš vymazať a zablokovať ich IP. Inak je to zbytočne.
Kvido
před 18 dny
Protože se ve Fóru objevilo několik SPAMů, je nyní registrace nových členů zapnuta přes e-mail a povolení hlavního administratora.
RobiNN
před 1 měsícem
4 témy sú v základnej inštalácii (na 4. téme robím) Ďalšie sú tu https://github.co...ion/Themes a tu https://github.co...ion-Themes
F
před 1 měsícem
Kdy bude více vzhledů, módů a všeho možného do php fusion 9? :-)