Zaslal: so září 12 2009, 8:35 Předmět: Nedostatek ve vyhledávání ve fóru
Zjistil jsem že při zadání kombinace všechna slova a následném vyhledávání je volba více slov (AND) neúčinná pokud jedno slovo má míň než tři znaky. Takže třeba zadání Fe plech vrací všechny příspěvky kde je slovo plech.
Založen: Sep 10,
2004 Příspěvky: 19927 Bydliště: Jičín, Český ráj
Zaslal: so září 12 2009, 9:51 Předmět:
Ano, o tom víme, už jsme to tu kdysi zkoušeli vyřešit. Pod tři znaky neumí php vyhledat nic. Konečně stejný problém má většina fór a vyhledávačů, které to obcházejí více či méně úspěšně.
Funkci "hledej přesný výraz, jak je zadán" se tu nepodařilo rozchodit vůbec.
Založen: Jul 21, 2006 Příspěvky: 25741 Bydliště: skoro Brno
Zaslal: ne září 13 2009, 11:57 Předmět:
Kdyby to indexovalo i dva znaky, tak ten vyhledávací soubor nebude mít 135MB jako teď, ale podstatně víc a tohle fórum by už dávno neběželo...
Mimochodem, má větší velikost, než samotná databáze příspěvků, to taky nasvědčuje něco o efektivitě phpbb.... _________________ Pro moje oslovení klidně použijte jméno Zdeněk
Správně navržené zapojení je jako recept na dobré jídlo.
Můžete vynechat půlku ingrediencí, nebo přidat jiné,
ale jste si jistí, že vám to bude chutnat[?]
Založen: Jul 21, 2006 Příspěvky: 25741 Bydliště: skoro Brno
Zaslal: ne září 13 2009, 16:09 Předmět:
Kdyby se tady mluvilo jen anglicky, má třetinovou velikost. Ale to je čeština, "moravština" , po slovensky a ještě ta nečitelná řeč tatrmanů ve dvaceti mutacích.... _________________ Pro moje oslovení klidně použijte jméno Zdeněk
Správně navržené zapojení je jako recept na dobré jídlo.
Můžete vynechat půlku ingrediencí, nebo přidat jiné,
ale jste si jistí, že vám to bude chutnat[?]
Zeptám se jako , k čemu je tedy dobré indexování když to vzápětí narazí na efektivitu vyhledávání a nakonec to omezí reálnou použitelnost? Jak souvisí indexování s počtem jazyků nebo nářečí? Když pustím mašinu na prosté vyhledávání řetězce v poli prvků, indexovací soubor nepotřebuju a rychlost bude úměrná velikosti databáze a výkonu mašiny.
Nedá se teda vyhledávání od ostatního chodu fóra fyzicky oddělit?
prosím srozumitelně pro laika
Založen: Jul 21, 2006 Příspěvky: 25741 Bydliště: skoro Brno
Zaslal: po září 14 2009, 11:12 Předmět:
Jde o rychlost a efektivitu. Prohledávat celou databázi kvůli každýmu hledání je velmi zdlouhavý. Takže se vytvoří setříděnej seznam odkazů na slovo a pak už to jde mnohem rychleji. Pokud má slovo dvacet tvarů, bude v indexu bohužel dvacetkrát - to k těm jazykům a nářečím.
Efektivita (pozn. - prohledávání celé databáze) je však z hlediska spotřeby zdrojů počítače obdobně nízká jako efektivita člověka hledajícího termín listováním v knize. Na druhé straně tato metoda funguje bez předchozí přípravy.
Naopak než budeme moci využít fulltextového vyhledávání, musíme nejdříve vygenerovat fulltextový index (čili naplnit tabulky FT_Word a FT_Index). Indexováním textu dochází k optimalizaci, protože náročné sekvenční procházení textu se provede pouze jednou. Často opakované vlastní vyhledávání pracuje s vhodně uspořádanými daty a trvá jen zlomek času. _________________ Pro moje oslovení klidně použijte jméno Zdeněk
Správně navržené zapojení je jako recept na dobré jídlo.
Můžete vynechat půlku ingrediencí, nebo přidat jiné,
ale jste si jistí, že vám to bude chutnat[?]
no dobře, tak dejme tomu rozšířením na dvouznaková slova by neúnosně stoupla doba vyhledávání a velikost index. souboru. Ta velikost je nějak technicky omezená?
Nedá se tedy nabídnout volba zda v případě neúspěšného hledání pokračovat v pomalém prohledávání celé databáze? Když budu opravdu potřebovat projet výskyt spojení "ŠR KONEKTOR" tak si holt počkám a místo za pět vteřin mi server pošle odezvu za deset minut.
Lexikální zásoba českého jazyka se udává od 48 000 slov v slovníku veřejné češtiny po asi 250 000 všech možných nepoužívaných tvarů. To mi nepřijde nijak tragické v době TB disků a GHz procesorů.
Nebo co rozlišit volbu hledat buď v indexu slovní zásoby obecného jazyka (to jsou ta nářečí a slang atd.) nebo v indexu věcných termínů (zkratky, typová čísla, cizojazyčné výrazy.) Jak to dělají pindows při projíždění na výskyt řetězce s souborech?
pracuje nějaký engine s rozlišením podle lexikologie? (pády slov, tolerance jiných koncovek, množná čísla, podobný pravopis..)
Založen: Jul 21, 2006 Příspěvky: 25741 Bydliště: skoro Brno
Zaslal: po září 14 2009, 11:37 Předmět:
Výkon běžnýho serveru přidělenej uživateli "elektroworld" s naším programem na hostingu pípni počítej řádově na úrovni Pentium II - a to hodně přidávám. Pust si na takovéto mašině vyhledávání ve 100MB souboru, nejlépe tak 20x naráz a přitom si zahraj třeba DOOM. Uvidíš, co se bude dít... _________________ Pro moje oslovení klidně použijte jméno Zdeněk
Správně navržené zapojení je jako recept na dobré jídlo.
Můžete vynechat půlku ingrediencí, nebo přidat jiné,
ale jste si jistí, že vám to bude chutnat[?]
Časy uváděny v GMT + 1 hodina Jdi na stránku 1, 2Další
Strana 1 z 2
Můžete přidat nové téma do tohoto fóra. Můžete odpovídat na témata v tomto fóru. Nemůžete upravovat své příspěvky v tomto fóru. Nemůžete mazat své příspěvky v tomto fóru. Nemůžete hlasovat v tomto fóru. Můžete k příspěvkům připojovat soubory Můžete stahovat a prohlížet přiložené soubory
Informace na portálu Elektro bastlírny jsou prezentovány za účelem vzdělání čtenářů a rozšíření zájmu o elektroniku. Autoři článků na serveru neberou žádnou zodpovědnost za škody vzniklé těmito zapojeními. Rovněž neberou žádnou odpovědnost za případnou újmu na zdraví vzniklou úrazem elektrickým proudem. Autoři a správci těchto stránek nepřejímají záruku za správnost zveřejněných materiálů. Předkládané informace a zapojení jsou zveřejněny bez ohledu na případné patenty třetích osob. Nároky na odškodnění na základě změn, chyb nebo vynechání jsou zásadně vyloučeny. Všechny registrované nebo jiné obchodní známky zde použité jsou majetkem jejich vlastníků. Uvedením nejsou zpochybněna z toho vyplývající vlastnická práva. Použití konstrukcí v rozporu se zákonem je přísně zakázáno. Vzhledem k tomu, že původ předkládaných materiálů nelze žádným způsobem dohledat, nelze je použít pro komerční účely! Tento nekomerční server nemá z uvedených zapojení či konstrukcí žádný zisk. Nezodpovídáme za pravost předkládaných materiálů třetími osobami a jejich původ. V případě, že zjistíte porušení autorského práva či jiné nesrovnalosti, kontaktujte administrátory na diskuzním fóru EB.