エクセルとChatGPTを使った発明者クラスター分析

少し前にエクセルの配列機能の特許情報分析への適用の可能性を感じて、事あるごとに開発しているのですが、エクセルとChatGPT-4を使ったなかなかマニアックな分析手法を確立できたので紹介します。

この手法では、所定の母集団についてDBからダウンロードした発明者と特許分類に関するデータを使います。今回使ったデータは1つ前の記事と同じTSMC社の1000件です。

そして、同じ出願において名前がある複数の発明者は共同発明者(共同研究者/研究チームの一員/事業部内メンバ)であるとして共同発明関係を機械的に認定するのですが、1件でも共同発明がある発明者同士は同じクラスターに属しているものとし全ての出願について処理を行って発明者のクラスターを全て特定します。

そして、各クラスターに含まれる全ての発明者がした全ての出願に付与された特許分類を集計することで、各クラスター(研究チーム)がどんな技術に関する出願をしているか、すなわちどんな研究をしているか深掘り確認するものです。

今回開発したエクセルツールでは、このような処理を簡単に行えるようにしています。
エクセルのフィルター機能を使えば同じようなデータも1つずつ生成することはできますが、作業の効率性や重複の排除などを考えた場合には専用のツールを使う方が便利です。

このツールでは以上のように、全ての発明者のクラスター(部門や研究チームなどに相当する)を特定しながら、対応する技術分野(特許分類)を特定することができます。

なぜこのようなツールを作ったかというと、ChatGPTは国際特許分類(IPC)や共通特許分類(CPC)のコードと説明の対応関係のデータは持っていることはわかっていたので、コードのリストさえ用意できれば任意の研究チームに関連する技術の内容を簡単に特定できるのではないかと考えたからなのです。

例えば、このように特定したIPCをChatGPTのプロンプトにコピペしたうえで「以上の国際特許分類が付された出願をしている研究チームはどんな技術について研究しているか300字以内で説明してください。」というように質問するとChatGPTはいい感じにまとめて概要を教えてくれます。
例えば上に示した#1のチーム(クラスター)であれば以下のような回答が返ってきます。

このように、共同発明関係に基づく研究チームがどのような研究をしているかを、コードを1つずつ読まなくても確認することができます。また、特定の技術との関連性を聞けば教えてくれるでしょう。

以上、前半で紹介したツールのように一括して処理することができるツールを新たに開発して使うのは難しいと思いますが、後段のChatGPTの使い方は真似してもらうとよいと思います。例えば、企業単位の技術ポートフォリオや強みを確認するような場合であれば、どこかで関連する特許分類のリストを取得して(各種の分析ツールで簡単に取得できます)、ChatGPTに貼り付けて聞くことで簡単に技術ポートフォリオなどを確認できると思います。よかったら試してみてください。

以上の手法を含め弊所では様々な特許情報分析の手法を用意しており、クライアントの要望に沿った分析手法の開発も行っています。
また、このような分析手法に関するセミナーや分析プロジェクトについても対応可能ですので、ご相談などありましたら管理人の特許事務所のページからお知らせください。
よろしくお願いします。