Dobrodružné výpravy do světů knih, filmů a seriálů. Bezpečný návrat není zaručen.

úterý 25. listopadu 2014

Tipy na knihy podle vašeho gusta? Zkuste Tisicknih.cz

Znáte aplikaci Tisíc knih? Zadáte jméno své oblíbené knihy a vyskočí na vás tisíct titulů, které by teoreticky měly být podobné a měly by se vám tedy taky líbit.



Tisícknih je aplikace, nad kterou srdce každého knihomola jistě zaplesá. Vyhledávání knih! Doporučování titulů! Trochu jako Goodreads, ale nepotřebujete k tomu další lidi. 
Ovšem hned v další chvíli přijde zaváhání: Jak na ty seznamy doporučovaných knih přišli? Pokud se budete pídit po informacích jako já, zjistíte toho velmi málo, konkrétně že: "Doporučení, které zde dostanete, jsou vytvářeny na základě poměrně jednoduchého (ale výpočetně náročného) algoritmu. Nelze očekávat, že všech 1.000 doporučení bude dávat smysl pro každého — právě proto jich dáváme tolik, aby si uživatel mohl vybrat." Další sdělení slibuje přednáška o vývoji a fungování aplikace z festivali DevFestu 2014 (měla by se později objevit na youtube, odkaz přidám, jen co bude zveřejněn). *
Velkou výhodou aplikace je, že vám ukáže stručnou anotaci doporučované knihy, pokud o ni máte zájem, a může vás přesměrovat na web Městské knihovny Praha. (Knihovna poskytla autorům aplikace přístup do své databáze a podílela se tak na realizaci projektu.)

Smysm to dává jen někdy a někomu
Aplikaci jsem jako správný knihomol hned vyzkoušela. Můžu potvrdit výše citované věty - hodně z doporučení mi nedává příliš smysl. Jiná jsou naopak tam prvoplánovitá, že na ně čtenář žádnou aplikaci nepotřebuje, pokud disponuje vlastním mozkem. Pojďme se ale podívat na několik konkrétních příkladů. 

Jako první jsem začala hledat shodu pro Pravidla moštárny od Johna Irvinga (jaké překvapení!). Prvních 12 knih tvoří prostě seznam dalších Irvingových děl - což je logický, i když ošidný postup. U spisovatele, který (jako Irving) svoje první knihy psal dost jinak než pozdější díla, může dojít k paradoxům. Podle seznamu je nejpodobnější Pravidlům moštárny Svoboda medvědům - takže klasicky románová Moštárna, s jasnou strukturou a poetickým, logicky vystavěným příběhem, se podobá absurdně-grotesknímu dílu. Raději jedeme dál. 

Naopak mě dost potěšilo, že hned po Irvingovi aplikace navrhuje knihy od Dickense (kterému se Irving stylem v novějších knihách hodně podobá - nádhlenrými dlouhými popisy nebo dopodrobna vykreslenými osudy všech postav, včetně těch vedlejších). Dobře aplikace odhadla i třeba Grahama Greena (kterého Irving řadí mezi své vzory; Tichý Američan je v seznamu na 19.místě). Na spodnějších místech žebříčku už se řetězí knihy, které mi moc smyslu v této souvislosti nedávají: třeba Rozum a cit od Austen na 67.místě. (Celý seznam knih spojených podle aplikace s Pravidly moštárny můžete najít zde.)

Jako další jsem zkusila Stráže!Stráže! od Terryho Pratchetta. To jsem očividně neměla dělat. Poučení zní: u tak plodných autorů se aplikace zaobírá hlavně jejich dalšími díly. Až do 50. položky jde jenom o knihy od něj, pak se občas jako zoufalý výkřik objeví jiný autor (na 51. místě Peter Haining: Šílení rytíři - za odvahu figurovat v obležení Pratchettů bych si ho hned přečetla!). 

Někde na 70. místě se objevuje Neil Gaiman se Sandmanem, až po stovce se prosazují ve většině i jiní autoři. Celý seznam můžou fanoušci Pratchetta hledat tady

Lepší než knihovnice?
Nebudu vás už dál zahlcovat podrobnostmi o svých dobrodružstvích na Tisicknih.cz. Zkuste si najít doporučení pro svoji oblíbenou knihu - a budu ráda, když dáte vědět, jestli výsledky podle vás odpovídají. Tisíc je opravdu hodně, zvlášť u knih, a do konce seznamu většinou stejně nedojdeme - aspoň pár titulů by ale mohlo splnit úkol a posloužit jako inspirace.
Je pravda, že každý čtenář mívá rád jiný aspekt knih, od konstrukce příběhu, typu postav až po prostředí nebo stavby vět. Proto je jasné, že se i doporučované knihy musí hodně lišit. Předpokládám, že hodně doporučení, která mi nedávají smysl, budou někomu jinému naprosto vyhovovat.

Takže hurá do knižní jungle. Je co prozkoumávat. Ale pokud máte svoji oblíbenou spolehlivou knihovnici ve vaší lokální knihovně, rozhodně bych zůstala u jejích doporučení. Nevychrlí na vás seznam tisíce knih, ale budou to knihy přesně pro vás.

* Doplnění z 29.11.2014: Toto video již bylo zveřejněno. Pokud máte zájem dozvědět se více o systému, jakým aplikace funguje, podívejte se sem. Případně doporučuji přečíst si komentář po tímto článkem od Anonyma, ve kterém princip vysvětluje. Můj názor na uživatelskou (ne)funkčnost, popsaný výše ve článku, se nemění. Základním problémem podle mého názoru je, že Tisicknih prezentuje sama sebe jako nástroj pro vyhledávání podobných titulů, ale ve skutečnosti vyhledává podobnost preferencí ve fiktivní skupině čtenářů, do které nás zadaná oblíbená kniha zařadila.

Zdroj úvodního obrázku: http://www.27newstreet.co.uk/new-street-antiques-and-craft-centre/cornerstone-books/ 

5 komentářů:

  1. Tisíce knih jsem měla před pár dny plný News Feed na Facebooku, a říkala jsem si, že prostě nemůže být 1000 knih podobných jedné knize. Očividně se to potvrzuje. Vyhledala jsem si Emmu od Jane Austen a ve druhé polovině je mimo jiné něco od Dicka Francise, životopis C. S. Lewise, detektivky od Agathy Christie, Mika Waltari a dokonce (!!!) Barbara Cartland. Z nějakého důvodu je 859. Great Expectations od Dickense a Nadějné vyhlídky až 1000. A na začátku je samozřejmě všechno od Jane Austen (včetně Opatství Northanger, Northangerského opatství a Northanger Abbey - ale to asi souvisí s knihovním katalogem) a její napodobeniny z poslední doby, a sestry Brontëovy, klasika.
    A jako druhé jsem zkusila Ďábel a slečna Chantal od Coelha. Nejpodobnější tomu je z nějakého důvodu jeho životopis, a pak všechny jeho ostatní knihy. A pak povídky o posmrtném životě a Lexikon magie. Dál už se neodvážím.
    Ještě jsem se podívala na Kdo chytá v žitě. Na 10. místě je Malá encyklopedie moderní ekonomie (?!!!), na 12. Velký Gatsby a na 13. Vyhoďme ho z kola ven (ano, budoucí Přelet nad kukaččím hnízdem). A na 25. místě je proces. Fascinující.
    Připadá mi, že Tisíc knih slouží spíš tak trochu pro pobavení. Nevím, jak ten generátor funguje, ale zdá se mi, že má opravdu vážné trhliny...

    OdpovědětVymazat
    Odpovědi
    1. S Malou encyklopedií moderní ekonomie jsi mě pobavila :D To Salinger určitě netušil, že má jeho dílo až TAKOVOU hloubku a tolik nevídaných vrstev :D Ten Proces mi překvapivě nepřipadá tam moc mimo, i když nedokážu vysvětlit proč (to budou ty různé perspektivy, jakými se díváme na knihy).
      Jinak taky by mě dost zajímalo, podle čeho vyhodnocují podobnost (kromě autora, což je jasné, a občas žánru). Doufám, že zveřejní to video z DevFestu a něco z toho pochopím.

      Vymazat
  2. Video máme tady https://www.youtube.com/watch?v=ZJq5pmpTpRM . Našel jsem tohle shrnutí od Petra Klimoviče:

    "Samotný princip je vysvětlen v prvních 15 minutách, dále pak následuje popis technologií, které k tomu byly použity. Takže.... Má k dispozici databázi výpůjček z Pražské knihovny za posledních 14 let. Je to 107 milionů půjčených knih. Má informaci o tom, že tehdy a tehdy si průkazka číslo X půjčila knihu Y. Takže když zadáte knihu, vyhledá to všechny, kdo si ji půjčili a sesbírá to informaci o tom co všechno si půjčili také. Pro každou takto zjištěnou knihu se spočítá jak často si ji půjčili všichni návštěvníci knihovny, tedy cosi jako její popularitu a porovná to s popularitou u těch, kdo si půjčili tu vámi zadanou knihu. Nakonec vám to tedy vypíše ty knihy, které jsou výrazně populárnější u skupiny, která si půjčila vámi zadanou knihu, než u průměrných návštěvníků. Chytré."

    PMK má asi 200 000 čtenářů. Pokud si například Válku s mloky půjčilo 10 000 z nich (vymyšlené číslo), její popularita je 10000/2000000 = 0.005.

    Pokud zadám do aplikace knihu "Stráže stráže", aplikace si v databázi najde čtenáře, kteří si tu knihu půjčili, a pro každou knihu vypočítá podíl, jaká část čtenářů Stráží si ji také přečetla. Pro ty Mloky to třeba (vymýšlím si) bude 0.05, takže 5 %. V porovnání s běžnou čtenářskou populací jsou mezi čenáři Stráží Mloci 10x populárnější.

    Seznam se vytvoří tak, že se knihy seřadí sestupně podle toho, kolikrát jsou populárnější mezi čtenáři zadané knihy a vypíše se prvních 1000 položek.

    OdpovědětVymazat
  3. Jo a pokud by vás zajímala teorie, ze které to vychází, tak je to (hodně zjednodušené, aby se to rychleji počítalo) https://en.wikipedia.org/wiki/Association_rule_learning

    OdpovědětVymazat
    Odpovědi
    1. Děkuji za komentář i za odkazy! Přesně tohle video jsem hledala a hodlala ho doplnit do článku (psala jsem článek dřív, než toto video zveřejnili).
      Přestože už snad chápu, jak to funguje - nebo právě proto - musím trvat na tom, že uživatelsky tato aplikace není moc dobrá. Nebo je špatně prezentovaná. "Zadejte knížku, kterou máte rádi, a my vám doporučíme tisíc podobných. " - o tohle ale nejde, ne? Ta aplikace nehledá podobné knihy, ale hledá knihy, které má ráda fiktivní čtenářská skupina, do které program zařadí i nás po zadání požadavku. Jsem tedy ve virtuální skupině milovníků Stráží a v ní jsou zároveň populární i Mloci, to je fajn - ale nic to neříká o podobnosti těchto knih! To je podle mě základní nedorozumění. Model nemluví o podobnosti knih, ale o podobnosti preferencí u čtenářů.

      Jinak odkazy do článku doplním. Děkuji.

      Vymazat