« OlderNewer
mining the social web and oreilly calendar監訳のお手伝いをした入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニックの見本紙が届きました!本の表紙の監訳のところにも名前が載ってます!うれしい!2012年のオライリーカレンダーも頂きました!
この本ですが、原著はMining the Social Webというもので、 Twitter / Facebook / LinkedIn / Google Buzz などのソーシャルネットワークサービスのデータだけでなく、Eメールやウェブページ内のメタデータなどからも様々な傾向や面白いことなどの抽出を試みています。各サービスの API も Python ライブラリも時間とともにどんどん変わっていくので、細かい点ではそのままでは動かない箇所もいくらかあると思います。これは原著を読んだ時点でもあったし、翻訳が終わった時点でもあって、できる限りアップデートしたのですがしょうがないことでしょう。そういう点はあるものの、この本で触れられているのと似たよう処理をしたいことは頻繁にあると思うので、そういう意味でも十分参考になると思います。
ちなみにこの本で書かれているサンプルコードですが、 Python で書かれています。データマイニングや検索がらみで Python だからということで、1月の終わり頃にバイドゥのときに一緒に働いていた水野さんに声をかけてもらって、面白いかどうか/日本語訳を出す価値があるかどうか/その他内容についてなどの評価をさせてもらいました。その後、日本語版を出すということが決まり、監訳という形でお手伝いさせてもらうことになりました。あれよあれよでもう11月も下旬ですが、そろそろ書店に並ぶ頃かと思います。面白い本なので是非手に取ってみて下さい。
Posted by setomits at 13:34 | Comments: 1
Google App Engine では実験的にDatastore Adminが利用できるようになっています。これはあるアプリケーションのデータエンティティを他のアプリケーションにコピーしたり、特定のエンティティのデータをまとめて削除したりということができる管理用の機能です。 Datastore Admin を使うためには左のメニューから Applications Settings を選び、 Datastore Admin の項目の横にある Enable というボタンを押すだけです。
とあるのですが、実際に管理コンソールからこれを使おうとしても真っ白になって何も表示されません。先日の appengine ja night 18 のときにtokibitoさんに相談したところ、 app.yaml にそういう設定を入れても良いんじゃないかとアドバイスを頂いたので改めて見てみたところ、確かにAdministering Your Datastore (Experimental) - Google App Engine - Google Codeにその方法が書かれていました。 app.yaml に
- url: /datastore_admin script: $PYTHON_LIB/google/appengine/ext/datastore_admin/main.py
という行を追加しておくと "http://myapp.appspot.com/datastore_admin" という URL で当該画面が表示されます。実際には login の項目も足して
- url: /datastore_admin script: $PYTHON_LIB/google/appengine/ext/datastore_admin/main.py login: admin
としておいた方が良いのかな。
なお、この画面でデータの削除をする際にも Datastore API のオペレーションは発生するので大量のデータ削除とかの場合は注意が必要です。
Posted by setomits at 14:19 | Comments: 2
先週末の2011年11月18日(金)、ニフティ株式会社のセミナールームで開催された appengine ja night 18 http://www.zusaar.com/event/170203 (技術者向けの Google App Engine の勉強会)で昼会の紹介をさせて頂きました。当日使用したスライドは SlideShare にアップロードしました。

ちなみにスライドのページ送りには Google Developer Day 2011 Tokyo のときにもらったzeemoteの JS1 H を使いました。詳しい使い方は Zeemote JS1 H 取扱説明書(PDF)にありますが、 Mac と Bluetooth でペアリングして、キーパッドモードにすると Keynote の操作ができるようになります。
Posted by setomits at 13:27 | Comments: 0
今日は午前中だけですが、Python Conference Japan 2011に行ってきました。エキスパートPythonプログラミングという結構良い本があるのですが、この本の現著者である Tarek Ziade さんのキーノートセッションが面白かったです。そろそろ Python 3 への移行も考えなきゃかなあ。どうしたもんかなあ。
Python Conference が日本で開催されるのは今回が最初で、一応僕もスタッフとして協力すると手を挙げていたのですが、あまりにもあれこれあり過ぎて全くお手伝いできていなくて申し訳ないです。僕自身もあまりよくわかっていないのですが、今回は「出会い」をテーマにしていたようです。だからというわけでもないのですが、ちょうどカカクコムのときの同僚だった椎野さんも来ていたので、よく会う Python 関係の友達何人かに紹介しておきました。あと、自分自身もなかなかすれ違いでお会いできなかった磯さんとちょっとだけですがお話しできて良かったです。
Posted by setomits at 22:57 | Comments: 2
Apache Solr入門 ―オープンソース全文検索エンジン前にも一度読んだのですが、改めて買ってApache Solr入門 ―オープンソース全文検索エンジンを読みました。この本があれば、一通り検索エンジンをセットアップして、インデックスを作って検索できるようにして、データが更新されるようにしてというところまでできるんじゃないでしょうか。いくつかの言語向けに検索サイト構築のサンプルも有るし、検索だけじゃないナビゲーションやサジェスト/スペルチェックなど、いくつかの機能にも触れられていて至れり付くせりな感じです。
ただいかんせん、この本では形態素解析器として Sen が紹介されているのですが、現行の Solr (3.1.0)では Sen は使えません。いずれ改訂版とかが出るんじゃないかという気もしますが、そういうわけでもしかしたら日本語を扱うあたりで躓いてしまうかもしれません。
Posted by setomits at 23:06 | Comments: 3
« OlderNewer
search
calendar
Feb 2012
SunMonTueWedThuFriSat
   1234
567891011
12131415161718
19202122232425
26272829   
archives
photos on flickr
www.flickr.com