IPCを正しく並べ替えるときに役立つ数式

今回は、Xで紹介したIPCを使って特許情報分析をするときにとても役立つ数式を紹介します。

IPCやFIなどの特許分類では
一番左のローマ字が「セクション」を、
右隣の2桁の数字を合わせて「クラス」を、
その右のローマ字を合わせて「サブクラス」を、
さらに右の数字を合わせて「メイングループ」を、
さらにスラッシュの右の数字をあわせて「サブグループ」を、それぞれ表します。

このような階層構造を有する特許分類において、メイングループを表す数字が通常は3桁で表されるのですが、例えばLens.orgで入手したデータなどでは、図のA列のようにメイングループを表す数字が1字又は2字の分類では1桁又は2桁に詰められてしまうことがあります。
このような場合に、例えば特許分類の並び順として画像のA2のセルの分類とA3のセルの分類とは画像の並び順に並べるのが正しいのですが、エクセルでA列について昇順に並べるとA3の分類が前になってしまい適切に並び替えることができません。


そこで、画像に示すような数式を用いることで、桁数に合わせてメイングループの数字の前にスペースを挿入することができます。これにより、B列を使ってソートすることで特許分類の正しい並び順に並べ替えることができます。

数式は以下となりますので、エクセルでIPCを使った分析をするときにはぜひ活用頂ければと思います。

=LEFT(A2,4)&
REPT(" ",3-(FIND("/",A2)-5))&
MID(A2,5,FIND("/",A2)-5)&
"/"&
RIGHT(A2,LEN(A2)-FIND("/",A2))

最後に注意点ですが、CPCには2000シリーズというより多い桁の分類もあるため、その分類を扱う場合にはこの数式を使うことはできません。

 ということで、今回は特許情報分析においてIPCを扱う場合に役立つ数式について紹介しました。弊所ではこのような手法を含め様々な特許情報分析の手法を用意しており、クライアントの要望に沿った分析手法の開発も行っています(なお、弊所では顧問契約をしていただいているクライアント様には弊所開発のツールを自由に利用して頂いています)。
 また、このような分析手法に関する個別指導・セミナーや、個別の分析プロジェクトについても対応可能です。ご相談などありましたら管理人の特許事務所のページからお知らせください。
 よろしくお願いします。