Portál AbcLinuxu, 22. května 2025 13:35

Google Books API: nepříjemnosti při implementaci a řešení

12.8.2011 22:54 | Přečteno: 1223× | Ostatní | poslední úprava: 13.8.2011 01:09

Pokud budete někdy chtít použít toto API, budete pravděpodobně, jako já, unešeni tím, jak je to jednoduché. Nicméně, jako vždy, není vše takové, jak se může zdát na první pohled. Dejte si ale pozor a čtěte pozorně dokumentaci!

Kdo vydal knihu?

První věc, se kterou se setkáte je, že místo vydavatele dostanete nějakou hloupost, nebo vůbec nic. “Tak Google nemá všechny informace”, řeknete si. Ale pokud se podíváte do webového rozhraní této služby, tak je tam vše v naprostém pořádku.

Příklad č.1:
http://books.google.com/books?id=TMkYAAAACAAJ
Vydavatel: Computer Press
https://www.googleapis.com/books/v1/volumes?q=isbn:9788025100233
Vydavatel není vyplněn.

Příklad č.2:
http://books.google.com/books?id=MWllLAAACAAJ
Vydavatel: Atom
https://www.googleapis.com/books/v1/volumes?q=isbn:9781905654284
Vydavatel: Gardners Books

Příklad č.3:
http://books.google.com/books?id=xZpJAAAACAAJ
Vydavatel: Computer Press
https://www.googleapis.com/books/v1/volumes?q=isbn:9788072268528
Vydavatel: Dobré knihy cz

Co s tím?

Na tento bug (nebo feature?) je poměrně jednoduché řešení. Ve webovém rozhraní služby si můžete, pokud sescrollujete dolů, všimnout fráze “Export Citation” a tří tlačítek. Můžete si tak stáhnout bibliografické informace o zobrazené knize ve třech formátech. Skvělá věc na tom je ta, že v těchto souborech už je vydavatel uveden správně.

Když získáváte info o knize pomocí GB API, dostanete také ve vráceném JSON poli (je to správná terminologie?) id knihy. A výše zmíněné soubory lze získat právě, pokud znáte toto id.

Konkrétně to můžeme napsat v PHP třeba takto:


$bookId = 'xZpJAAAACAAJ'; // do této proměnné doplníme ID získané z JSON dat získaných požadavkem na Google Books API
$publisherName '';
$workaroundData = file('http://books.google.com/books/download/?id='.$bookId.'&output=enw');
foreach ($workaroundData as $line) {
	if (substr($line, 0, 3) == '%I ') {
		$publisherName = trim(substr($line, 3));
		break;
	}
}

Po položení dotazu dostaneme JSON pole, které obsahuje mimo jiné položku "selfLink", ve které je URL API dotazu na konkrétní svazek (volume).
Pokud použijeme API dotaz pro získání konkrétního svazku, narozdíl od vyhledávacího dotazu dostaneme vydavatele již zcela správně.

Odkud že jsi?

Poněkud horší je už tato věc. Po nahrání aplikace na server jsem zjistil, že mi google hází chybu 503. Po chvíli zkoumání jsem přišel na to, že při GB API požadavku si google zjistí pomocí nějakého Geo IP nástroje odkud jste (poté k tomu poskytuje nějaké relevantní data související se zemí, odkud pocházíte). Což není nic zajímavého – tedy v případě, když Vás Google dokáže zařadit. Můžete se také dozvědět toto:

{
 "error": {
  "errors": [
   {
    "domain": "global",
    "reason": "unknownLocation",
    "message": "Cannot determine user location."
   }
  ],
  "code": 503,
  "message": "Cannot determine user location."
 }
}

Jako první mne napadlo, že bude vina na straně poskytovatele. Nicméně jako odpověď na můj dotaz jsem dostal následující:
“... my bohužel netušíme, jak Google tyto informace zjišťuje. My máme tyto informace korektně zaevidované v databázi RIPE. Víc pro to udělat nemůžeme.”

Zkoušel jsem IP serveru (46.28.108.131) prohnat různými webovými nástroji s různými výsledky – někde našli a někde zase nenašli ... Google asi tedy používá nástroj, který spadá do druhé, jmenované skupiny.

A s tímto problémem si už rady nevím. Teoreticky je možno vytvořit nějakou proxy, ale něco prakticky použitelného mne opravdu nenapadá. Šance, že Google s tím něco udělá (napsal jsem jim tam) je dle mého názoru mizivá.

Napadá nějaké řešení Vás?

Řešení tohoto "problému" lze nalézt na webu dokumentace Google Books API. Prakticky se jedná pouze o nastavení hlavičky X-Forwarded-For.

Děkuji uživateli chrono, že mne navnadil, abych prošel znovu dokumentaci a našel tam řešení problému č.2 a nahodil elegantnější řešení problému č.1 :-)

       

Hodnocení: 100 %

        špatnédobré        

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Nástroje: Začni sledovat (2) ?Zašle upozornění na váš email při vložení nového komentáře. , Tisk

Vložit další komentář

13.8.2011 00:04 chrono
Rozbalit Rozbalit vše Re: Google Books API: nepříjemnosti při implementaci
Odpovědět | Sbalit | Link | Blokovat | Admin
Nechce sa mi čítať dokumentácia k tomu API, ale podľa toho q v URL tipujem, že ide o hľadanie. Nájdené položky majú, teda aspoň tie z blogu, aj hodnotu selfLink a tam už je aj vydavateľ.
saly avatar 13.8.2011 00:51 saly | skóre: 23 | blog: odi_et_amo
Rozbalit Rozbalit vše Re: Google Books API: nepříjemnosti při implementaci
Tak to mne nenapadlo. Je mi tedy ale stále záhadou, proč se nezobrazí korektní vydavatel i v hledání. Prolezl jsem teď znovu dokumentaci a nic. Nicméně děkuji mnohokrát!
Luboš Doležel (Doli) avatar 13.8.2011 00:13 Luboš Doležel (Doli) | skóre: 98 | blog: Doliho blog | Kladensko
Rozbalit Rozbalit vše Re: Google Books API: nepříjemnosti při implementaci
Odpovědět | Sbalit | Link | Blokovat | Admin
Je fakt, že ta IP adresa je na ČR dost neobvyklá. Osobně bych 46.x.x.x tipnul na USA.

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.