reizist's blog

ウェブ

小林銅蟲先生のブログでマルコフ連鎖

こんにちは。

漫画「めしにしましょう」が好きすぎて、

著者である小林銅蟲先生のブログ

negineesan.hatenablog.com

を漁り読む日々を過ごしています。

小林銅蟲先生っぽい」文章が面白くて文体を真似るファンが続出しているのを観測しており、人気の高さが伺えます。 まだ読んでいない人はめちゃくちゃおもしろいので今すぐ読みましょう。

さて、今日は朝7時に目覚めてしまったので、何を思ったかマルコフ連鎖で「小林銅蟲先生っぽい」文章を自動生成してみることにしました。 ※ブログ掲載にあたって小林銅蟲先生に許可を頂きました。

マルコフ連鎖とは

wikipedia を見てもさっぱりでした。

概要だけ把握する場合、

マルコフ連鎖を説明してみる。 | 分析のおはなし。

が参考になりました。 今回は要するに 「既存の文章を適当につぎはぎして自動で文章作る」のが目的です。

余談ですが、しゅうまい君もマルコフ連鎖で作られているようです。

準備

まず手始めにマルコフ連鎖に必要なデータを取得します。 パルスクレイピングして全てのブログ記事をtxtに落とし込みました。 (すべての記事からマルコフ連鎖するとそこそこ実行時間がかかったので最終的には取得記事を絞ってます)

これらの記事を1つのファイルに結合し、これを基データとしました。

また、マルコフ連鎖のために形態素解析を行います。これにはMeCabを使用しました。 rubyから使用する場合、 Nattoが便利です。

(macの場合)

brew install mecab mecab-ipadic
gem install natto
require 'natto'
 
text = '使用後はとても爽やか。'
 
mecab = Natto::MeCab.new('-Owakati')
p mecab.parse(text)
# => "使用 後 は とても 爽やか 。 \n"

以上が実行できれば環境はokです。 あとは以下のアルゴリズムに従って文章を作成します。

  1. 形態素解析を行い基データを単語に分割する
  2. 文章を複数語で構成されるprefix(接頭語句)と1語のsuffix(接尾語)に分割しテーブルを生成
  3. テーブルからprefixを選択し、prefixの後ろにつなげるsuffixをランダムに選択

結果

実行結果を並べてみます。

こんにちは。今回のイブニングのめしは新年一発目なので、なんかテフロン加工鍋的なものを食うことにしています。その他各種臓器も、消化器は開いて汚れを洗ってから茹でて、、冷水でも骨は確かにウッてなる。でもうまいのでOK。工夫を考えていきます。成敗ウーウオーウーオウッオいやーびっくりしすぎて、それどこでアンコウ鍋をやってみたところ、全然うまかった。ていうか生活が苦しい時代よりも明らかに良いものを使うと平和っぽく作ることがわかります。前回あとなんかマツコがマ文脈牡蠣ですはいだるかったのかと勉強になり、これ全体がコラーゲンじゃないのって感じで陳列があり、それは焼いたパンに乗せたらいい感じの肉があり、それについての補足を簡単にしているのか知らんけどいきなり茹でてみたく、さらに漫画も描けるから経費パワーも使えるという、デメリットが一切ない企画です。解体を丁寧にやると木っ端の骨が出てきます実際松茸と霜降り肉は1人200gを超えるとしにます翌日もだるまちゃん先生家では本命のあれを茹でましょうモリモリいきますはいまず肝臓を確保血管を割いて血を抜こうとしてくれろという取引がございます。白子はググったら高級っぽくて、アンコウらしいヒラヒラが映えますすっきりいわゆるちょうちん的な箇所は引っ張れば普通にクリアできるヒレに皮が残りがちだけどヒレから皮取ったら食うとこないだろ説もあるのでよーく茹でてますねおもむろに白子が出ていますエラには酢が到達して煮てもいいんだけど削ることに2500円を出すか?というとこういうことがわかってきます実際松茸と霜降り肉は合うと思う、別にテフロンじゃなくてゼスターグレーターでパルミジャーノを削っている状態でも骨は確かにウッてなる。でもうまいのでOK。工夫を考えていますねおもむろに白子が出ないので丸呑みした胃を裏返してよく洗いますなんだかんだで皮膚が破損する湯通ししたねびっくりしすぎて、こんなふざけたものでは甘すぎるので醤油を足して二番だしをとります。肉ですそれ以外です味変ガンガン混ぜることで大阪のイベントの帰りに高島屋今半で肉をかまぼこにしてからよく噛んで食ってうまいしなんなら吊るし切りもやっています結構でかい切ると中は超魔界村の4面みたいになって1.5kg買ったけど食ったらいけました。食感だけでここまで嗜好性がいまいちよくわからないものを洗い流していて、こんなふざけたものではこのように死ぬ思いをしています。幸いシーズン最後の出荷分をゲットできて、何のために口の中で水分がガンガン出るので水はなるべく少なめにところで肝はうまかった記憶がありとてもおいしい。その他各種臓器も、消化器は開いて汚れを洗っていましたねびっくりした胃を、そろそろ、、とにかくできました。10分だかガッツリ茹でるのでノロウイルスはしにますスーパー計量タイム配合は忘れたので速攻で帰りました。その足でマテガイ採集に向かったということです。文脈ですが、それはそれとして参戦します。エラです。金曜の朝8時に市場へ着くと観光目的の人間はいきなり死ぬ」について主に考えてみたらこれもまた別件で、小骨の激しい部位の肉がありますとれたまだ頬肉がガッツリシカトされたので、合理的なものがどろどろと溶けていきます。のでこれは大洗で揚がってかつ内臓が出ないので丸呑みしたね。
こんにちは。イブニングで2話掲載がよくあり(よくあるのです)、今回もなのかなこれ謎腸に黄色いクリームみたいなのですがショップ情報には酢が到達しています皮湯通し後の世界です身の迫力を楽しみたいのでグッと大ぶりにカット炊いていきますハサミの方が便利だったハローいろんなのがはっきりしました。ていうか生活が苦しい時代も忘れて、しかしアシに入る日がそこから7日くらいあったので、折角だから大洗に行くことになりました。口の中で世界になります。店もここ以外やってみたく、さらに漫画も描けるから経費パワーも使えるという、デメリットが一切ない企画です。一応ニンニクやショウガもおろせるらしい。つうことで煮えました。アンコウはうまいです。ポタージュっぽくもありかなこれ謎腸に黄色いクリームみたいなのがあります。その他各種臓器も、消化器は開いてくるところでウツボは小骨がいろいろ邪悪で、厚削り節と鴨のガラが冷凍庫にあったのでめしです1kg1万円ぐらいで存在しやがって、アンコウの初心者にわりと取り付く島がなくなったのでめしです1kgパワーモリモリ割くはい肉よくわかんないのでここでラクができますが10kg級になるのでフードプロセッサで粉砕します。一体どうすれば、、冷水でも骨は確かにウッてなる。でもうまいのでOK。工夫を考えてみましょうゆでた肝は固まりませんでしたが種類でいろいろあるんでしょう。胆嚢なのがいますはいはい人ん家を色んな角度から撮りますフムッ超時空バトル四の五の言わずぶちこみます以下、意味不明ですたぶん脾臓、味がとにかくきれいでうまいでは肉を外し終わったヒレを取りましょうモリモリいきます。やりました。実用的に硬質チーズや柑橘類を削りたい人間がどれくらいいるか」「人間はいきなり死ぬ」について主に考えています。これは固さとしては片はんぺんくらいで結構柔らかいのだから大洗に行くことに2500円を出すか?そんなことは特に気にして煮ます中華粥のニュアンスにするため、20分だか20分だか20分とかでぼちぼちじゃね?みたいになってほしい。年末最高。そんで年末の話です。よろしくお願いします。詳しくは各自読んでもらうとして、、冷水でも骨は確かにウッてなる。でもうまいのでOK。工夫を考えていき、お前こんなふざけたものが世界に存在しやがって、そういえばクセもなくうまかった記憶があり、これも仕事ですね。
こんにちは。ブログ的に崩壊します。血管ぜんぶ引っこ抜いて細かく切って針ごと収容する)、調理環境に持ち込んだ時点ではまだ生きてたので昆布を足して二番だしをとります。とてもぬめっている酢まんべんなく塗りたくるこの状態のアンコウはうまい。よかったですね。
色々なことをしなければ平気だと思って元気付けのために今日もめしを食ってよいものだろう」との差異はよくあり(一部地域で「人体を食べることにつきましてはこれで14リットルだったので、買う際に「この袋はたべられませんでした。ていうか卵は高いやつだと取り回しが微妙なったのでそれに直交させればよいという知見があり、醤油、オイスターソース、(酢)、片栗粉、で餡をぶっかけました。これは何が起こっている塩とごま油と塩でざっくり洗って濾してニンニンク、ショウガに漬けて放置します。これは急いでた牛です。600gくらいでしたが、昔の偉い人の歴史や思想的なものを選びました。よかったですね。
色々なことが予想された臓器があり、同じ肉ではないでしょう。ジャガイモを茹でます。うま界さてこの当時、ぶっちゃけあんまり変わらなかったことになり、タタキが鬼のようなこと、うまいです。同様にする人はやっていくことで告知が出ますね。
色々なことが出来ず、糊を食ってうまい。よかったですね。

所感

本家の面白さには至らず力不足を感じましたが、とはいえそこそこおもしろい文章が生成できて満足です。

今回は完全ランダムでしたが、マルコフテーブルを作成する際文節の出現頻度のスコアリングするなどすることでもっと「っぽい」文章が作れるかもしれません。

よかったですね。

2017年2月 開発PC環境

12月にMacbook Pro 2016(Lately) が届いて以降、今までの環境を抹消しゼロから環境構築を始めた。

2ヶ月ほど経ったのでそろそろ環境に慣れ/落ち着いてきたのでメモ程度にまとめようと思う。

基本思想としては、「なるべくシンプル且つモダンな方に寄せる」です。ギークなエンジニアのコンソールとか見てると「すげー」となるけど、そのためにあれやこれやとスクリプトを導入してメンテをするのも面倒なので。

シェル

zshを使用。以前はoh-my-zsh使ってたけど、やたらめったら重いのと、どのツールがどの挙動に影響を及ぼしているのか追うのもめんどくさいくらいもりもりに色々入っていたので、zplugに移行した。

移行に際して、主に以下の記事を読めば概要をつかめる。

fishへの移行も頭をよぎったけどzshに不満はないしエコシステムもzshは豊富なので保留。

CLI

汎用

peco

インタラクティブでインクリメンタルなフィルタリングツール。CLI弱者だけどこれはもうかなり重宝している。 後述するghqとの連携、プロセスのkill, コマンド履歴操作、ブランチの削除などなど使っているものは幅広い。

この記事を書く直前までpeco中の移動に矢印キーを使っていたのだけど、不便なのでvimライクなキーバインドで操作できるように~/.peco/config.json に以下を記述したのでCtrl+jとかで操作できるようになった、便利。

    "C-j": "peco.SelectDown",
    "C-k": "peco.SelectUp",
    "C-q": "peco.Finish",
    "C-l": "peco.ScrollPageDown",
    "BS": "peco.ScrollPageUp"

ghq

リモートレポジトリ管理ツール。 まんまこの記事をそのままの設定で使っている。便利すぎか。

ghqでリポジトリ管理とpeco連携で快適git生活

gitmoji

一時期前に「commit messageの頭に絵文字をつけよう」という話がバズり、各社/個人ルールで絵文字を定義する記事が乱立した。

qiita.com

qiita.com

atomの開発で絵文字を推奨しているのがことの発端なのかな?

/.git/template でプロジェクト単位のテンプレ作ったりしてるのが現状だと思うんだけど面倒なのでgitmoji に任せている。(とはいえ絵文字の選択にもにょりを感じたりはある)

tig

git commit log見たり中身見たり。

web

httpie

curlの代替としてのhttp request client。

hey

パフォーマンスチェック用。以前はboomって名前だったのにheyってなんだheyって。ネームスペース被ってググラビリティを優先したんだろうか

mattn/memo

3日前くらいから使い始めた。 今までmarkdownでちょろっとメモをとりたいときとかは、文章量が多い順にatom, vimを使っていた。 atomはプレビュー見ながら書けるけど起動が重い、vimは起動早いけどプレビュー見れない。 また他のメンバーに共有したい場合、slackにpostするかqiita teamにはるか、何かシェアする手段が必要だった。 mattn/memo は起動が早く(エディタにvimを使用)、memo serve で気軽にプレビュー/シェアできる(ローカルサーバー建ててURL共有する)ので重宝しそう。

エディタ

使用頻度で rubymine > vim > atomvimIDE並の機能にするまでメンテする気が起きなかったのと、gemのソース見るのとかさくっとできるので金の力で解決。JetBrain社に圧倒的感謝。

という状態だったんだけど、2日前にneovim環境を構築し始めた。 今まで vim + neobundle だったんだけどneovim + dein.vimに移行中。Shougoさんは神(使うOSSで一通りShougoさんが登場して本当に足を向けて寝られない)

音楽プレーヤー

iTunes or play music desktop player or vlcapple music会員なので洋楽のジャケ買いというかジャケ借りでひたすら好きなジャンルをあさりつつ、高校生までTSUTAYAに通い集めたJ-ROCKなどは全てgoogle musicにアップしているのでplay music頼り、最近flacで取り込むようになってからはvlcで対応している(統一したい)。

仮想OS

pararrel desktop for macが半額くらいでセールで買えたので稀に使う。今日(2/12)もゲリラセールやってて¥5,000しないで買えるようだ。

n.shop.vector.co.jp

その他macGUIツール

Shiftit

ウィンドウの位置と大きさをシュッと変えるやつ。

alfred

もはやデファクトといえるランチャー。 alfred2時代にPower Support買ってたけど使う機会少なかったのでalfred3では無料の範囲内で使っている。

その他は以下

reizist ~ $ brew cask list
1password               cheatsheet              licecap                 shiftit                 vivaldi
alfred                  dash                    origin                  skitch                  vlc
appcleaner              duet                    rstudio                 slack                   xquartz
atom                    google-japanese-ime     rubymine                steam
bettertouchtool         java                    sequel-pro              the-unarchiver

Amazon Echo Dotが来た

amazon echo dotがやってきたので試した。

f:id:reizist:20170125134944j:plain

何者なのかは

www.gizmodo.jp

とか

www.amazon.com

とかを見るとわかる。

一言で表すと凄い音声認識技術付きIoTbluetoothスピーカーという感じで、

「Hey Alexa, play today"s hit on Pandora」と言って音楽を再生させたり「Wake me at 6 am」と言ってアラームをセットしたり、

amazon dash buttonと同じように 「音声」をスイッチャーとしてAmazon lambdaと連携して好きなイベントを発火させることができる。

もちろん普通のbluetoothスピーカーとしても動作するので、iphonebluetoothで接続しiphoneから音楽を再生することもできる。

音声認識技術の精度が凄くて、英語ならほぼほぼ認識してくれてよしなに何かしてくれる。 予めサービス連携しておくと接続したサービス内の処理をしてくれるので、iphoneがなくても唐突に音楽を聞けるという体験は最高に未来感がある。 amazon iot buttonと同様、設定を行う方法としてはweb or アプリがあるが、 iosアプリは米国appleアカウントが必要なので手間がかかる。

しかしweb dashboardからでも

連携サービスの設定ができたり、 f:id:reizist:20170125224306p:plain

インターネット上に落ちている「能力」を得ることができたり、 f:id:reizist:20170125224310p:plain

音声認識のフィードバックが送れたりと必要十分感がある。

今はオフィスに一台あるのだけど、音声認識の精度が凄く凄いので家にも一台欲しい。

とはいえ日本での入手はまぁまぁ困難で、メルカリに1st gen が転がっていたりするくらいで、

amazon.co.jpでも在庫切れが続いている状態。

完全にスマートハウス化している各位は買うと捗るんじゃないかな。

Coursera MachineLearning -Week1- done

年始早々39.5℃の熱を出して仕事休み気味で厳しい

なんとか駆け込みでweek1を終わらせた。

https://www.coursera.org/learn/machine-learning/home/week/1

機械学習の入門として教師あり学習/教師なし学習のそれぞれの使い所等を説明した概論と、 バッチ勾配降下法を定義するまでに必要な数学的予備知識の説明・復習というところまでがweek1の内容であった。

バッチ勾配降下法が簡潔にまとまっているのでリンク。

postd.cc

ほぼほぼ概論だけではあったが偏微分が出てきてちょっと「ウオッ」と言って身構えてしまう程度には数式が出てきた。 今のところ問題はない。

week2からはおそらくoctaveなどを使ってアルゴリズムの実習をしたりしていくんじゃないかな。 ワクワク。

macbook airにarch linuxを焼いてデュアルブートする

macbookpro2016が届いてmacbook airが不要になってしまったので、売ろうとも思ったけど大した価格にもならないだろうし、おもちゃにしてみる。 手順はqiitaの記事そのまま行うので都度参照する。

デュアルブートするにはHDDのパーティション等の設定も手動で行わなくてはいけないので、まずはsierraをクリーンインストールしHDDの初期化をする。

  • sierraを通常通りインストールし、
  • リカバリモードで起動( ⌘ + R + 電源 ) し、
  • ハードディスクをフォーマットし、
  • sierraの新規インストール

の手順で行う。

手元のPCではインストールに30分かかるようだったので、インストールしている間にmacbookproを使ってarch linuxのUSBローダを作った。

公式サイトより最新のISOを落とし、ddで焼く。

sudo dd if=/Users/reizist/Downloads/archlinux-2017.01.01-dual.iso of=/dev/disk2 bs=1m

なお対象USBは diskutil list で検索し、必要であれば diskutil unmount /Volumes/<name> しておく。

OSのインストールに時間がかかっているので途中。

低音調理器具ANOVA買った

昨今流行っている低温調理を行うベストプラクティスとして知られるANOVA(The Anova Precision Cooker)を買った。 一言で言うと水温をあげつつ撹拌してくれる物体で、今まで低温調理というとヨーグルト作成機や炊飯器を使って逐一温度を確かめる方法が主流で、各々の工夫が試されていた。 2万程度でその手間が解消されるということで、買わない手はないと話題に。

ANOVAには二種類あって、bluetoothだけでスマホ連携するやつ

と、wifiも繋げられる上位互換のやつ

がある。ちなみに2nd gen というのは最新のやつで、ワット数が800W->900Wにあがっているので多少水温を温める能力が上がっている。 とはいえANOVAは「温度調整」にステ振りしてあるので、「温度上昇」はそこまで得意ではない。 自分の場合は温めたい温度-5℃くらいまで普通にコンロで温めてからANOVAを投入し調整をする方法をとればいいかというのと、wifiで接続できることにそこまで魅力を感じなかったのでbluetoothの方を買った。

ちなみに電源部は3Pとなっていて、そのままでも使えると言われているものの電源タップなどの導入が面倒だったので

を買って2Pにして使っている。

ANOVAを買って一回目の調理としては、低温調理の代名詞・ローストビーフをやることにした。 美味しい肉の火の入れ方などはぐぐって調べるとして、一旦寝ている間の動作検証も含めて12Hやってみた。

出来上がりとしては最初はこんなものか、という感じで、手間なく今まで手動で作っていたものと同じかそれ以上の肉が作れた、程度の感情。 多分12hが長すぎたというのと、オーストラリア産の雑な肉作ったのでもう少しいい肉で試したい。 次は鶏ハムかなんか作ろうかなー

引っ越してから最高に作業が捗る

引っ越す前は自分の部屋は無くリビングに座椅子が一つあるのみで開発環境としては底辺だった。

今や一人の部屋でソファーやテーブルがあり開発したい時に開発ができて最高、良い習慣はまず環境から