#2694

数値を並べて遊ぶ


音楽


このブログでは近年、定期的に話題にするものとして定着してきた
”の話。今はiTunesライブラリ再生回数ランキング、
とでも言った方が正しいし伝わりやすいと思うのですが、
今日はそんな再生数データの大整理をしていました。
というか、現時点でまだ終わっていません。

昨日は07時半起きが祟ったのか、せっかく早寝の準備を済ませて
22時には寝床に就いたのに、延々と眠れずに
珍しくサイト更新の構想を練る妄想が止まらなかったり、
挙げ句の果てにはgoogleカレンダーと延々にらめっこしていたりと、
眠れないという割には非充実感を感じない夜でした。
まぁ眠れないのは実際困っていたわけですが……。

サイトの更新計画は、特設サイトの浄化を最初考えていたのですが、
それも急務だけどもっと直近の課題がこの音楽再生数統計の整理だろう、
という結論に達して今日の計画が珍しく具体的に決まり、
実際にそれに関して行動できただけでも、最近の自分にしては好調と言えるのですが、
再計算待ちで時間が潰れまくったのはちょっと否めないかなと……。
そんなわけで、今日はおそらく自分以外には伝わらないであろう
ライブラリの再生回数記録の整理の話で埋めようと思います。
前もちょっとしたかも。

2007年09月にスタートしたこの再生数記録の従来の方式は、
まず、過去一ヶ月以内に入れたアルバム等の曲の基本データ(曲名など)を入力して、
先月以前の曲の先月時点での累計をあらかじめコピーしておき(新曲はすべて0再生)、
統計日になったらその時点での累計を全部コピペして
先月以前の数値との差分を算出する、という方式でした。
算出したシートはまるごとコピーして次月分に流用し、その時の累計も
次は先月分データとして繰り返し使う事で
その月ごとの詳細データを一目で見られるようにしたつもりでした。
実際、最初期から現在まで、月ごとの偏差値だとか急上昇ランキングとか
ランクインポイントとか、合計再生時間ランキングとか、その占有率だとか、
もうさまざまな情報がくっついて、今では21.4MBと
スマートフォンの説明書のpdfファイルをも凌ぐ容量になってしまっています。

で、ふと新本家サイトで音楽の紹介もしてみたいな、と思ったのが
この大整理作業の発端でした。
要するに、現在の方式だとその月ごとの詳細データは事細かに見る事ができるものの、
再生回数がどのように推移してきたか、どこに隆盛時期があったのかといった
ブームの流れや傾向というものを調べるのがとても難しかったんですよね。
しかし、いざ曲ごとの過去44ヶ月間の再生回数を抜き出そうとしても、
曲名の付け方規則といった基本情報の根幹に関わる部分が
この四年間で大分様変わりしてしまっていたり、
肝心の整理番号もなんだか統制が取れておらずごちゃごちゃだったり、
何しろ基本情報も先月分をコピペ、を繰り返しては気まぐれに修正したものだから
44ヶ月間の長い伝言ゲームのような様相になってしまい、
単純に過去のシートをひっくるめて並べてコピペ、では済まなくなったのでした。

そこでやってみたのが、全部の再生回数データを一列に並べてみるというもの。
約4,000曲×44ヶ月分=176,000個。
ただ、言うまでもなく最近入れたものほど履歴のデータ量は少ないので、
実際に空データとならないデータは17万より遙かに少ない66,000個ほどでした。
それを全部一列に並べて、まずは整理番号のゆがみを修整。
修正版整理番号+統計期を組み合わせた固有の番号をそれぞれの情報に割り振って、
あとは別シートに整理番号×統計期の表を作って、
その176,000個の枠にlookup関数を使って該当するデータを全部埋めていきました。

これ自体は、ちょっとググってみれば多分誰でもできる程度の事なのですが、
如何せんデータ量がこのPCのスペックを遙かに上回っている量らしく、
上述のlookup関数を使って埋める作業をオートフィルで計算させるだけで
実に4時間半もの時間を費やしました。
その後は、出てきた曲別の統計期順再生回数の一覧をほくほくと眺めながら
曲名やアーティスト名を入れようと列の挿入をしようとしたのですが、
そういう細かい作業をしようとする度にPCが一瞬固まっては再計算が始まり、
無理矢理次の作業をしては再計算が、というのを繰り返していたら
限界が来たのか応答なしの状態になり、さらに3時間ほど、
ついさっきまでPCが頑張っていました。
ようやく復帰したところで、最後にレートの推移も見てみたいと言う事で
再生数一覧表をコピペしてレート用にいじくってみたら、
そこでまた応答不能になり、今に至ります。

とりあえず、まだまだ味付けが足りないところではあるものの、
前々から考えていた再生数推移の一覧化というのは
具現化するところまで行けて何よりでした。
この後、最後の修羅場であるアルバム名打ち込みを乗り越えたら
レビューの前準備までおおよそたどり着いた事になるかなと。
今回、これを急務にした理由は、
45ヶ月目の統計がもう4日後に迫っているからなんですよね。
せっかく一列にまとめるところまで行ったんだからなんとか統計日までに決着付けたい、
と思ったのが、PCにとっては悪夢の再計算地獄の始まりだったという事に。

ちなみに構想は大分前だったよなぁ、などと思いつつざっと調べてみたら、
なんと2010年10月06日のノートにすでにこの作業計画の事が書いてありました。
当時は、2010年10月10日の日付が並ぶ日に更新する計画を練っていて、
そのうちの候補のひとつがこれだったみたいです。
今現在の新本家サイトにもある、項目別にミニテーブルを作る方式なんかは
将来は音楽レビューもする事を念頭に置いてデザインしていた記憶があります。

もっと遡ってみると、新本家サイトが後に2010年10月10日に更新する時の
トップページ刷新計画の構想は、奇しくもちょうど一年前の2010年07月06日に
草案として書かれていました。長い伏線だったんだなぁと関心したりもしますが、
逆に言えばそれって相当の間化石化していたっていう事でもあるんですよね。
いざ行動してみれば今日一日で具現化するところまで言ってしまったという。
まぁ、近年の自分にはよくあるパターンだと思います。

01時半就寝08時起床の今日は中間休日ですが奨学金関係で大学に行かなければならず、
その前後は上に書いたExcelの再計算待ちでほとんど過ごしていました。
待っている間は久々にポップンミュージックポータブルに手を出して、
ゴールデンウィーク直後以来久々に7ボタンを埋めたりも。
そんなこんなで、何もやらなかったわけでもない、
かといってひとつのゴールにたどり着いたわけでもなかった一日でした。
この後もどうせ2時間半ほどは眠れないだろうけど、
今待機中の再計算はそんな時間では終わらないだろうしなぁ……。

0

コメントを残す