Google Patents APIは、特許情報を取得するためのツールです。しかし、このAPIは2011年5月26日に公式に非推奨となりました。そのため、データの信頼性については保証されていません。
それでも、特許情報を取得するための代替手段として、PythonのBeautiful Soupを使用して各結果を解析する戦略があります。以下にその一例を示します。
import urllib2
import json
from bs4 import BeautifulSoup
url = ('https://ajax.googleapis.com/ajax/services/search/patent?' + 'v=1.0&q=barack%20obama')
request = urllib2.Request(url, None, {})
response = urllib2.urlopen(request)
jsonResponse = json.load(response)
responseData=jsonResponse['responseData']
results = responseData["results"]
for result in results:
URL = "https://www.google.com/patents/"+result["patentNumber"]
req = urllib2.Request(URL, headers={'User-Agent' : "python"})
_file = urllib2.urlopen(req)
patent_html = _file.read()
soup = BeautifulSoup(patent_html, 'html.parser')
patentNumber = soup.find("span", { "class" : "patent-number" }).text
assigneeMetaTag = soup.find("meta", { "scheme" : "assignee"})
patentAssignee = assigneeMetaTag.attrs["content"]
print "patent no.: ", patentNumber
print "assignee: ", patentAssignee
print " "
このコードは、Google Patentsの各ページから特許情報を取得します。ただし、注意点として、取得できる譲渡先は特許が発行された時点のものであり、譲渡が行われた場合の現在の譲渡先は取得できません。
また、google-patent-scraper
というPythonパッケージも存在します。このパッケージを使用すると、特許のHTMLを解析したり、特許リストから情報を取得したりすることができます。
以上の情報を参考に、PythonとGoogle Patents APIを活用して特許情報を取得する方法を探求してみてください。