Vítejte na Elektro Bastlírn?
Nuke - Elektro Bastlirna
  Vytvořit účet Hlavní · Fórum · DDump · Profil · Zprávy · Hledat na fóru · Příspěvky na provoz EB

Vlákno na téma KORONAVIRUS - nutná registrace


Nuke - Elektro Bastlirna: Diskuzní fórum

 FAQFAQ   HledatHledat   Uživatelské skupinyUživatelské skupiny   ProfilProfil   Soukromé zprávySoukromé zprávy   PřihlášeníPřihlášení 

Nedostatek ve vyhledávání ve fóru
Jdi na stránku 1, 2  Další
 
Přidat nové téma   Zaslat odpověď       Obsah fóra Diskuzní fórum Elektro Bastlírny -> Provoz fóra
Zobrazit předchozí téma :: Zobrazit následující téma  
Autor Zpráva
Crifodo



Založen: Oct 11, 2005
Příspěvky: 15005

PříspěvekZaslal: so září 12 2009, 8:35    Předmět: Nedostatek ve vyhledávání ve fóru Citovat

Zjistil jsem že při zadání kombinace všechna slova a následném vyhledávání je volba více slov (AND) neúčinná pokud jedno slovo má míň než tři znaky. Takže třeba zadání Fe plech vrací všechny příspěvky kde je slovo plech.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
Hill
Administrátor


Založen: Sep 10, 2004
Příspěvky: 19925
Bydliště: Jičín, Český ráj

PříspěvekZaslal: so září 12 2009, 9:51    Předmět: Citovat

Ano, o tom víme, už jsme to tu kdysi zkoušeli vyřešit. Pod tři znaky neumí php vyhledat nic. Konečně stejný problém má většina fór a vyhledávačů, které to obcházejí více či méně úspěšně.
Funkci "hledej přesný výraz, jak je zadán" se tu nepodařilo rozchodit vůbec.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
Crifodo



Založen: Oct 11, 2005
Příspěvky: 15005

PříspěvekZaslal: so září 12 2009, 20:03    Předmět: Citovat

hmmm Sad takže zase jednou zvítězila neživá hmota nad člověkem.
Google i Seznam to zvládá, asi nepoužívá PHP.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
rnbw



Založen: Mar 21, 2006
Příspěvky: 34857
Bydliště: Bratislava

PříspěvekZaslal: so září 12 2009, 20:13    Předmět: Citovat

Tu nejde o ziadne PHP (to je programovaci jazyk), ale o to, ze sa neindexuju slova kratsie ako 3 znaky.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
ZdenekHQ
Administrátor


Založen: Jul 21, 2006
Příspěvky: 25741
Bydliště: skoro Brno

PříspěvekZaslal: ne září 13 2009, 11:57    Předmět: Citovat

Kdyby to indexovalo i dva znaky, tak ten vyhledávací soubor nebude mít 135MB jako teď, ale podstatně víc a tohle fórum by už dávno neběželo...

Mimochodem, má větší velikost, než samotná databáze příspěvků, to taky nasvědčuje něco o efektivitě phpbb....

_________________
Pro moje oslovení klidně použijte jméno Zdeněk
Správně navržené zapojení je jako recept na dobré jídlo.
Můžete vynechat půlku ingrediencí, nebo přidat jiné,
ale jste si jistí, že vám to bude chutnat[?
]
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Zobrazit autorovy WWW stránky
rnbw



Založen: Mar 21, 2006
Příspěvky: 34857
Bydliště: Bratislava

PříspěvekZaslal: ne září 13 2009, 14:31    Předmět: Citovat

Vyhladavaci index ma skoro vzdy viac ako samotne data. To je fakt a nie je to o "efektivite phpbb".
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
masar



Založen: Dec 03, 2005
Příspěvky: 13017

PříspěvekZaslal: ne září 13 2009, 14:52    Předmět: Citovat

Skoro se mně chce zeptat " ...a o čem to tedy je?" Wink
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
rnbw



Založen: Mar 21, 2006
Příspěvky: 34857
Bydliště: Bratislava

PříspěvekZaslal: ne září 13 2009, 15:47    Předmět: Citovat

O principe fulltextoveho vyhladavania.
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
ZdenekHQ
Administrátor


Založen: Jul 21, 2006
Příspěvky: 25741
Bydliště: skoro Brno

PříspěvekZaslal: ne září 13 2009, 16:09    Předmět: Citovat

Kdyby se tady mluvilo jen anglicky, má třetinovou velikost. Ale to je čeština, "moravština" , po slovensky a ještě ta nečitelná řeč tatrmanů ve dvaceti mutacích....
_________________
Pro moje oslovení klidně použijte jméno Zdeněk
Správně navržené zapojení je jako recept na dobré jídlo.
Můžete vynechat půlku ingrediencí, nebo přidat jiné,
ale jste si jistí, že vám to bude chutnat[?
]
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Zobrazit autorovy WWW stránky
rnbw



Založen: Mar 21, 2006
Příspěvky: 34857
Bydliště: Bratislava

PříspěvekZaslal: ne září 13 2009, 17:34    Předmět: Citovat

Ano, s tymi roznymi tvarmi jedneho slova je to problem. Google to ma nejako vyriesene, ale obcas ma to serie, ked to potom hlada ine veci ako chcem...
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu
masar



Založen: Dec 03, 2005
Příspěvky: 13017

PříspěvekZaslal: ne září 13 2009, 17:34    Předmět: Citovat

rnbw napsal(a):
O principe fulltextoveho vyhladavania.

Aha...ehm...pardon. Wink
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
Crifodo



Založen: Oct 11, 2005
Příspěvky: 15005

PříspěvekZaslal: po září 14 2009, 10:27    Předmět: Citovat

Zeptám se jako obrazek_cenzura, k čemu je tedy dobré indexování když to vzápětí narazí na efektivitu vyhledávání a nakonec to omezí reálnou použitelnost? Jak souvisí indexování s počtem jazyků nebo nářečí? Když pustím mašinu na prosté vyhledávání řetězce v poli prvků, indexovací soubor nepotřebuju a rychlost bude úměrná velikosti databáze a výkonu mašiny.
Nedá se teda vyhledávání od ostatního chodu fóra fyzicky oddělit?
prosím srozumitelně pro laika Rolling Eyes
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
ZdenekHQ
Administrátor


Založen: Jul 21, 2006
Příspěvky: 25741
Bydliště: skoro Brno

PříspěvekZaslal: po září 14 2009, 11:12    Předmět: Citovat

Jde o rychlost a efektivitu. Prohledávat celou databázi kvůli každýmu hledání je velmi zdlouhavý. Takže se vytvoří setříděnej seznam odkazů na slovo a pak už to jde mnohem rychleji. Pokud má slovo dvacet tvarů, bude v indexu bohužel dvacetkrát - to k těm jazykům a nářečím.

http://www.root.cz/clanky/princip-jednoducheho-fulltextu-1/

Efektivita (pozn. - prohledávání celé databáze) je však z hlediska spotřeby zdrojů počítače obdobně nízká jako efektivita člověka hledajícího termín listováním v knize. Na druhé straně tato metoda funguje bez předchozí přípravy.

Naopak než budeme moci využít fulltextového vyhledávání, musíme nejdříve vygenerovat fulltextový index (čili naplnit tabulky FT_Word a FT_Index). Indexováním textu dochází k optimalizaci, protože náročné sekvenční procházení textu se provede pouze jednou. Často opakované vlastní vyhledávání pracuje s vhodně uspořádanými daty a trvá jen zlomek času.

_________________
Pro moje oslovení klidně použijte jméno Zdeněk
Správně navržené zapojení je jako recept na dobré jídlo.
Můžete vynechat půlku ingrediencí, nebo přidat jiné,
ale jste si jistí, že vám to bude chutnat[?
]
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Zobrazit autorovy WWW stránky
Crifodo



Založen: Oct 11, 2005
Příspěvky: 15005

PříspěvekZaslal: po září 14 2009, 11:29    Předmět: Citovat

no dobře, tak dejme tomu rozšířením na dvouznaková slova by neúnosně stoupla doba vyhledávání a velikost index. souboru. Ta velikost je nějak technicky omezená?
Nedá se tedy nabídnout volba zda v případě neúspěšného hledání pokračovat v pomalém prohledávání celé databáze? Když budu opravdu potřebovat projet výskyt spojení "ŠR KONEKTOR" tak si holt počkám a místo za pět vteřin mi server pošle odezvu za deset minut.
Lexikální zásoba českého jazyka se udává od 48 000 slov v slovníku veřejné češtiny po asi 250 000 všech možných nepoužívaných tvarů. To mi nepřijde nijak tragické v době TB disků a GHz procesorů.
Nebo co rozlišit volbu hledat buď v indexu slovní zásoby obecného jazyka (to jsou ta nářečí a slang atd.) nebo v indexu věcných termínů (zkratky, typová čísla, cizojazyčné výrazy.) Jak to dělají pindows při projíždění na výskyt řetězce s souborech?
pracuje nějaký engine s rozlišením podle lexikologie? (pády slov, tolerance jiných koncovek, množná čísla, podobný pravopis..)
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Odeslat e-mail
ZdenekHQ
Administrátor


Založen: Jul 21, 2006
Příspěvky: 25741
Bydliště: skoro Brno

PříspěvekZaslal: po září 14 2009, 11:37    Předmět: Citovat

Výkon běžnýho serveru přidělenej uživateli "elektroworld" s naším programem na hostingu pípni počítej řádově na úrovni Pentium II - a to hodně přidávám. Pust si na takovéto mašině vyhledávání ve 100MB souboru, nejlépe tak 20x naráz a přitom si zahraj třeba DOOM. Uvidíš, co se bude dít...
_________________
Pro moje oslovení klidně použijte jméno Zdeněk
Správně navržené zapojení je jako recept na dobré jídlo.
Můžete vynechat půlku ingrediencí, nebo přidat jiné,
ale jste si jistí, že vám to bude chutnat[?
]
Návrat nahoru
Zobrazit informace o autorovi Odeslat soukromou zprávu Zobrazit autorovy WWW stránky
Zobrazit příspěvky z předchozích:   
Přidat nové téma   Zaslat odpověď       Obsah fóra Diskuzní fórum Elektro Bastlírny -> Provoz fóra Časy uváděny v GMT + 1 hodina
Jdi na stránku 1, 2  Další
Strana 1 z 2

 
Přejdi na:  
Můžete přidat nové téma do tohoto fóra.
Můžete odpovídat na témata v tomto fóru.
Nemůžete upravovat své příspěvky v tomto fóru.
Nemůžete mazat své příspěvky v tomto fóru.
Nemůžete hlasovat v tomto fóru.
Můžete k příspěvkům připojovat soubory
Můžete stahovat a prohlížet přiložené soubory

Powered by phpBB © 2001, 2005 phpBB Group
Forums ©
Nuke - Elektro Bastlirna

Informace na portálu Elektro bastlírny jsou prezentovány za účelem vzdělání čtenářů a rozšíření zájmu o elektroniku. Autoři článků na serveru neberou žádnou zodpovědnost za škody vzniklé těmito zapojeními. Rovněž neberou žádnou odpovědnost za případnou újmu na zdraví vzniklou úrazem elektrickým proudem. Autoři a správci těchto stránek nepřejímají záruku za správnost zveřejněných materiálů. Předkládané informace a zapojení jsou zveřejněny bez ohledu na případné patenty třetích osob. Nároky na odškodnění na základě změn, chyb nebo vynechání jsou zásadně vyloučeny. Všechny registrované nebo jiné obchodní známky zde použité jsou majetkem jejich vlastníků. Uvedením nejsou zpochybněna z toho vyplývající vlastnická práva. Použití konstrukcí v rozporu se zákonem je přísně zakázáno. Vzhledem k tomu, že původ předkládaných materiálů nelze žádným způsobem dohledat, nelze je použít pro komerční účely! Tento nekomerční server nemá z uvedených zapojení či konstrukcí žádný zisk. Nezodpovídáme za pravost předkládaných materiálů třetími osobami a jejich původ. V případě, že zjistíte porušení autorského práva či jiné nesrovnalosti, kontaktujte administrátory na diskuzním fóru EB.


PHP-Nuke Copyright © 2005 by Francisco Burzi. This is free software, and you may redistribute it under the GPL. PHP-Nuke comes with absolutely no warranty, for details, see the license.
Čas potřebný ke zpracování stránky 0.14 sekund