Google Patents APIは、特許情報を取得するためのツールです。しかし、このAPIは2011年5月26日に公式に非推奨となりました。そのため、データの信頼性については保証されていません。

それでも、特許情報を取得するための代替手段として、PythonのBeautiful Soupを使用して各結果を解析する戦略があります。以下にその一例を示します。

import urllib2
import json
from bs4 import BeautifulSoup

url = ('https://ajax.googleapis.com/ajax/services/search/patent?' + 'v=1.0&q=barack%20obama')
request = urllib2.Request(url, None, {})
response = urllib2.urlopen(request)
jsonResponse = json.load(response)
responseData=jsonResponse['responseData']
results = responseData["results"]

for result in results:
    URL = "https://www.google.com/patents/"+result["patentNumber"]
    req = urllib2.Request(URL, headers={'User-Agent' : "python"})
    _file = urllib2.urlopen(req)
    patent_html = _file.read()
    soup = BeautifulSoup(patent_html, 'html.parser')
    patentNumber = soup.find("span", { "class" : "patent-number" }).text
    assigneeMetaTag = soup.find("meta", { "scheme" : "assignee"})
    patentAssignee = assigneeMetaTag.attrs["content"]
    print "patent no.: ", patentNumber
    print "assignee: ", patentAssignee
    print " "

このコードは、Google Patentsの各ページから特許情報を取得します。ただし、注意点として、取得できる譲渡先は特許が発行された時点のものであり、譲渡が行われた場合の現在の譲渡先は取得できません。

また、google-patent-scraperというPythonパッケージも存在します。このパッケージを使用すると、特許のHTMLを解析したり、特許リストから情報を取得したりすることができます。

以上の情報を参考に、PythonとGoogle Patents APIを活用して特許情報を取得する方法を探求してみてください。

投稿者 admin

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です