パワークエリによるデータ分割作業の効率化

パテントマップ作成に使うDBからダウンロードしたCSV等のデータは、特許分類や出願人などがカンマやセミコロンで分割された状態で1つのセルに複数含まれる構成になっていて分析に使うのが難しいことがあります。

このようなデータを使って分析するとき、私はパテントマップEXZのような有償ツールを使うか、エクセルの関数を組み合わせて1つのセルに1つのデータになるように分割する操作を行っていました。
しかし、エクセルの関数を組み合わせ分析するたびにデータ分割する準備操作はかなり手間がかかっていました。

ところで、別の記事を作成するためにエクセルの技能習得にオススメの動画チャンネルを確認していたところ、この記事の末尾にリンクを掲載した動画を見つけました。この動画によると複数のデータが改行区切されて含まれるセルをパワークエリを使うことで簡単に複数行に分ける操作ができるということでした。

それならば分析用のCSV等のデータもパワークエリでデータ分割できるのではないかと検討したところ、非常に簡単に分析用のデータの分割ができたので操作方法について紹介します。

まず、分割するデータをテーブルに設定しておきます。そして「データ」タブから「テーブルまたは範囲から」を選びます。

するとパワークエリエディタが表示されるので、分割する列をクリックした状態で「列の分割」をクリックします。

表示されるウィンドウでは分割方法がいろいろと選択できるようになっているため、区切文字を選んだり入力し、詳細設定オプションから分割方向を「行」に選び「OK」します。これを分割する列だけ行います。

これにより下に示すように1セル1データのデータセットに分割できるようになるので「閉じて読み込む」を選び処理を完了します。

そうすると、下に示すように1セル1データのデータセットとなりました。このように準備することでこのデータに基づきピボットテーブルを使った分析もできるようになります。

こんなに便利な方法があるのに取り込めていなかったのは口惜しいですね。パワークエリはなんとなく新しい機能のような気がして検討していなかったのですが、実はoffice2010から使える機能で多くのエクセルユーザーが利用可能な機能なのもわかりました。

また、ここでは説明しませんが分析に役立つ別の使い方もありますので興味があればいろいろと検討してもらえればと思います。

この記事を作成するきっかけになったのは、いつものExcelドカタCHです。エクセルにはパワークエリだけでなくほかにもいろいろな機能がありますが、このCHではそれらも紹介してくれているのでしっかり押さえて効率化していきたいですね。