関数マスター(笑)の技をとくとご照覧あれ!(J-PlatPat仕様のFIのカンマ区切りを修正する方法)

ということで、今回の記事では、エクセル関数を使って作った見た目はあまり賢くないけど役に立つ数式を紹介します。

前提として、J-PlatPatでダウンロードできるCSVにはFIのデータも含まれていて、これを特許情報分析に使うことができます。
ここで問題になるのが、J-PlatPatのダウンロードデータの仕様なのですが、2つのFIの間がカンマで区切られているのはよいものの、FIと展開記号(数字3桁)との間も同じカンマで区切られているため、このFIのデータをカンマ区切りで分割してしまうと、展開記号がFIから意図しない形に分割されてしまいます。

このため、例えば、画像の8行目のようなFIは、そのままカンマ区切りで分割するとサブグループに相当する「G06Q50/18」と展開記号の「310」に分割されてしまいます。

そこで、画像の数式バーに示すように、A列のFIに対してSUBSTITUTE関数を8回重ねて置き換えることで、セクションを表す「,A」から「,H」を「;A」から「;H」に変換しています。


このように変換することで、B列に示すFIのように、FI間は「;」で分割し、FIのサブグループまでの数字と展開記号の数字との間は「,」で分割するようになります。これにより異なる区切文字で区切ったデータすることができ、このFIを分割する際には「;」を区切文字として使うことができるようになります。結果として、展開記号を意図せず分割してしまったデータを使わずにFIを使った特許情報分析をすることができるようになります。

なお、数式は画像の通りですが、下に置いておくのでよかったら使ってみてください。

=SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(A2,",A",";A"),",B",";B"),",C",";C"),",D",";D"),",E",";E"),",F",";F"),",G",";G"),",H",";H")

このような置き換えはいろいろな方法で実装できますが、互換性や読みやすさを考慮して今回はこの形にしました。
関数を重ねすぎることでいわゆるネストの深い数式は分かりにくくなりやすく、「頭の悪い」数式と揶揄されがちですが、このような使い方はよいのではないかと思いました。

今回の記事は以上です。

 弊所では今回説明したようなツール・手法など様々な特許情報分析の手法を鋭意開発しており、クライアントの要望に沿った分析手法の開発も行っています(なお、弊所では顧問契約をしていただいているクライアント様には弊所開発のツールを自由に利用して頂いています)。

 また、このような分析手法に関する個別指導・セミナーや、個別の分析プロジェクトについても対応可能です。ご相談などありましたら管理人の特許事務所のページからお知らせください。

 よろしくお願いします。