明日会社がなくなっても

明日会社がなくなっていても動揺しないように、情報を残していきたい

「Empirical Methodology for Crowdsourcing Ground Truth」という論文を読んで

機械学習研究会で読んだ論文のメモ https://github.com/mlnagoya/surveys/tree/master/20181018_reports

Empirical Methodology for Crowdsourcing Ground Truth

疑問

  • アノテータで合意を取るのは一般的?
  • Knowledge base curation?

Finally, expert annotators are not always available for specific tasks such as open domain question-answering or news events, while many annotation tasks can require multiple interpretations that a single annotator cannot provide

This is a novel approach for crowdsourcing human annotation that, instead of enforcing agreement between annotators, captures the ambiguity inherent in semantic annotation through the use of ambiguity-aware metrics for aggregating crowdsourcing responses.

用語

英語

  • aquire : 学ぶ
  • readily : たやすい
  • tedious: 退屈な
  • viable : 実行可能な
  • gain populararity : 人気を得る
  • over and over : 何度もなども
  • heritage : 遺産
  • hypothesis: 仮説
  • inherent : 固有の
  • address: 取り扱う
  • harness : 利用する
  • the aim is to: 目的は
  • intrinsically : 本質的に
  • applicable : 適切な、利用可能な
  • as a consequence : 結果として
  • deduce : 推測する
  • redundancy : 冗長性
  • majority vote: 多数決

感想

  • 論文のメインであるGroundTruthという手法の中身がよく分からなかった。たぶんF値が影響すると思うんだけど。。。
  • 論文が長くて、読みきれなかった。もう少し短い論文を選び、内容をしっかり理解できるようにしよう。
  • 今回論文を読むのに使った時間は、約5時間。

他の人の発表で気になったこと

  • ShuffleNet
  • DenseNet
  • NASNet
  • Dataset
  • Weighted Sigmoid Gate unit
  • L1正則化
  • COCO2017
  • PFN: 512GPU
  • batch normarization
  • wamup
  • PFDet
  • F値の平均のmicro, macro

2018/10/05 読み聞かせ

小学校5年生の朝読で読み聞かせしました。

読んだ絵本

ぜつぼうの濁点

www.ehonnavi.net

  • 読みたかった絵本がやっと読めた!
  • 反応はまったくなかったけど、しっかり聴いてくれていたと思う。朗読に近い本は、あまり客席を見ないので、本当に聴いてくれていたかは分からない。
  • 読んでいる途中に、読み手が飽きてしまった。う~ん、どう工夫をすればよいのだろうか。

補足

  • 「ぜつぼうの濁点」つながり、「世の中は澄むと濁るで大違い~」という昔の歌を、いくつか紹介しました。
    • ハケに毛はあり ハゲに毛はなし
    • 福に徳あり 河豚に毒あり
    • キスは甘いし キズは痛いし
    • カラスは飛び立ち ガラスは飛び散る
  • 「河豚に毒あり」は、少し笑ってくれた
  • 歌の説明を、どこまですればよいかが分かりませんでした。

どうぶつどどいつ

www.ehonnavi.net

  • 「ぜつぼうの濁点」が10分と長いので、短い本を絵本を用意しようとして持ってきたのが、これです。
  • 動物について歌った都都逸が、「あ」から「ん」まであります。「か」、「そ」、「せ」を紹介しました。「そ」の「ぞうの相談」は、笑ってくれました。
  • 最後は、子供たちに、ひらがなを言ってもらい、それの都都逸を答えました。
  • サイズが小さい絵本ですが、「どどいつ」という言葉からも分かる通り、高学年用です。
  • 似た絵本に「どうぶつどどいつドーナッツ」というものがあるんですが、こちらはすべての都都逸が「~おいしいな」で終わっています。特に韻を踏んでいる訳でもなく、ただ七・七・七・五というだけで、これは都都逸ではないと思い、この本は読みませんでした。

気になった絵本

ちいさなつきがらす

www.ehonnavi.net

  • からすの羽の部分が、銀色に光っていて綺麗です。
  • 少し後味が悪い絵本。なんか納得できない。

機会学習に関する読みたい論文

アノテーション

https://arxiv.org/abs/1808.02350 https://arxiv.org/abs/1808.08180 https://www.cs.cornell.edu/~kb/publications/SIG15ProductNet.pdf https://arxiv.org/pdf/1806.11230.pdf

Polyps

https://arxiv.org/pdf/1809.06408.pdf

croudsourcing

https://arxiv.org/pdf/1710.08880.pdf https://arxiv.org/pdf/1809.09528.pdf https://arxiv.org/pdf/1809.08888.pdf

量子化学

https://arxiv.org/ftp/arxiv/papers/1809/1809.02723.pdf https://arxiv.org/pdf/1808.04526.pdf

PyCon2018に参加しました

PyConとは

PyConJp2018の概要

https://pycon.jp/2018/

参加費

  • 参加費は高い?Patronは40000円
  • Buisinessで参加しました

スポンサー

https://pycon.jp/2018/sponsor * テックビューロ: Diamond * メルカリ: Gold * GROOVE X: Gold 仮想通貨は儲かっている?

基調講演、招待講演

  • Kaufmann Manuel
  • 磯 蘭水
  • 中山 浩太郎(東大の松尾さんが欠席になったため)

通常講演、Lighting Talk

https://pycon.jp/2018/event/conference https://pycon.jp/2018/event/sessions * 講演のレベルが、Beginner, Intermediate, Advance, Allの4つ * 講演は5〜6会場

PyCon2018 Tutorial

参加したきっかけ

  • 今までカンファレンスに参加したことがなかったので、参加してみたかった おもしろかった講演

Kaufmann Manuel(基調講演)

https://www.youtube.com/watch?v=KwmF5wyY2C4 車で旅行しながらPythonを南米に普及させた熱い男の話(Python Argentina) モチベーションが上がる講演だった。 以下、メモ * コミュニティに恩返しをどのようにすればよいか? * 車の中にベットを作り1人旅行して、広める。→ 彼女に振られた。 * ヤギに車を壊された * ジャグリングも学んだ * プログラマだけでなく人。coding,coding,codingだけではダメ。

REST API に疲れたあなたへ贈る GraphQL 入門

RESTの問題

  • API仕様のドキュメント管理が大変
  • APIのドキュメントと実装がずれてケンカ
  • 1ページを表示するのに何個もAPIをたたかなければならない

GraphQL

  • RFCドラフト
  • RESTの次に来る
  • クエリ言語
  • 型指定可能
  • クライアントが必要なものだけをリクエス
  • AWSのAppSync便利
    • ドキュメントの自動生成
    • Queryの実行環境がある
    • APIのたたき方はAppSyncで確認できる

感想

  • AppSync便利!
  • AppSync以外でGraphQLを使うには?
  • 招待講演する?

メルカリにおける AI 活用事例(千葉 竜介)

https://pycon.jp/2018/event/sessions

niconicoにおけるコンテンツレコメンドの取り組み

https://pycon.jp/2018/event/conference

自己紹介

類似生主レコメンダ

  • トピック分布
  • sklearn : Latend Dirichiet Allocation
  • perplexity
  • spark
  • CountVecotrizer
  • Pipeline
  • トピック数を25個としてモデルにした
  • タグ関係ツリー:親子関係がある
    • 共起度、シンプソン係数

グレコメンダ

  • Sparkで10分間で計算する

    リアルタイムレコーダ

  • Jubatus: PFN×NTT

  • 協調フィルタリング

    レコメンダコーディネータ

  • レシピ:yaml

  • InfluxDB, Grafnaでクリック率の可視化

  • API: Tornado

  • Docker, Kubernetes Cluster

    モデルのデプロイ方法

  • redisに格納

    サービスの監視

  • DataDogで監視、Slackに通知

    質疑応答

  • 現状モデルのバージョン管理はできていない。バージョン管理していきたい。

    感想

  • 知らない単語がいっぱい出てきた

  • わからない言葉はたくさんあったけど、退屈しない講演で、充実した時間だった

その他聴いた講演

東大松尾研流 実践的AI人材育成法

PyCon JP における子ども向けワークショップの活動事例と実施の意義

自分が欲しいものをPythonで書く方法(Python for Myself)

Pythonでやってみた」:広がるプログラミングの愉しみ

聴いていなけどおもしろそうな講演

実践・競馬データサイエンス

https://logmi.jp/313650

Pythonistaの選球眼(せんきゅうがん) - エンジニアリングと野球の目利きになる技術

https://logmi.jp/313910

RustとPython

https://logmi.jp/313765

料理やグッズ

グッズ

  • Tシャツ
  • pandasチートシートが掲載されたクリアファイル
    • 便利!
  • 各企業のステッカー(zen of pythonなど)
  • カバン

    料理

  • おいしい!豪華!

  • おやつのクッキーにPythonのロゴが付いている
  • ペットボトルのラベルにPythonのコードが書いてある

    企業ブース

翔泳社の書籍が20%オフ * zozoスーツ購入可能

その他

  • 会場のWi-Fi速い
  • 電源タップあり

    興味ある講演が満席問題

  • 人気がありそうな講演(競馬や選球眼など)は、ほとんど満席になる。

  • 人気な講演はサテライト会場で視聴できるが、どの講演がやっているかは分からない
  • 聴きたかった講演が聴けない!
    • 会場Aに行くが満席→会場Bへ行くが満席→人気だからサテライトやっているかも。サテライト会場へ行くが、やっていない。そのまま興味ない講演を聴く
  • 対策: 人気のありそうな講演を聴く場合は、あらかじめ前の時間帯から会場に座り、興味ない講演を聴いていた。なんだかなー

    全体の感想

  • Django, 機械学習/データ分析、「Python使ってやってみた」の発表が多い

  • Youtubeに動画がアップロードされているなら、参加しなくても良いかな。。。聴きたい講演も聴けなかったし。。。
  • とはいえモチベーションは上がった
  • PyConに参加する前までは、カンファレンスは上級者が参加するものだという考えだったが、むしろ初心者が参加すべきだという考えに変わった。
  • 来年のPyConはたぶん参加しないけど、Python以外のカンファレンスには参加してみたい!

初めてIT系のカンファレンスに参加しました。

今まで私は、IT系のカンファレンスを学会のようなものだとイメージしていました。最先端の技術に関する発表が多く、その技術に関して熟知していないと、参加しても理解できない、と思っていました。

しかし、PyConは初心者向けや全体向けの発表が多く、Pythonの基本的な知識(構文やライブラリの概要)を知っていれば、十分理解できました(PyConの講演のレベルはBeginner, Intermediate, Advance, Allの4つだが、Advanceは1つしかなかった。ただし、Advanceにすると参加者が少なくなるとか、これくらい知っていて当然だよね、という理由からBeginnerやAllが多いのかもしれない)。

なので、IT系のカンファレンスは、技術に熟知している人よりも、技術にそれほど詳しくない人や、これから詳しくなりたい人が、参加した方が良いと思いました。これから学ぼうする人にとっては、すべての講演が新鮮で、開発や学習のモチベーションが上がると思います。逆に技術に熟知している人は、既に知っていることがほとんだったりで、カンファレンスに参加しなくてもWeb上の記事を読むだけで済むのではと思いました。

来年のPyConはたぶん参加しないと思います。理由は①Youtubueでライブ配信されるので、わざわざ東京に行く必要がない、②席の関係で興味ある講演が聴けない可能性がある、③参加費が高い、です。今回の支出は、交通費20000円、参加費15000円、宿泊費8000円の合計43000円です。会社が出してくれたので問題はないのですが、それでもやっぱり高いと思います。その変わりPyConではなくScalaMatsuriやHTML5 Conferenceなど、Python以外のカンファレンスに参加してみたいです。

9/21 絵本の読み聞かせ

小学校4年生の朝読で、絵本の読み聞かせを行いました。

ゆうだち

www.ehonnavi.net

  • 朝読は15分なのに10分かけて読んでしまった。
  • 「おしっこをちびった」で少し笑ってくれました
  • 笑いはなかったけど、たぶん真剣に聴いてくれたのだと思う

せきとりしりとり

www.ehonnavi.net

  • 時間がなかったので、少し早口で読んでしまった
  • 表紙をめくった部分を見せるのを忘れてしまった

9/3 絵本の読み聞かせ

読んだ絵本

ちゅうちゅうたこかいな

www.ehonnavi.net

  • クイズ形式の赤ちゃん絵本。
  • 結構盛り上がったので、また読みたい

おさかないちば

www.ehonnavi.net

  • 読みやすい
  • 魚が細かく描かれていて、図鑑にもなりそう
  • 普段食べている魚に興味が湧くような本でした

ポルトガルのむかしばなし はしれ!カボチャ

www.ehonnavi.net

  • 文章の繰り返しがおもしろい

気になった絵本

せつぼうの濁点

www.ehonnavi.net

  • 小学校中学年以上で読みたい!
  • 七五調で読みやすい

ぼくのふとんはうみでできている

www.ehonnavi.net

  • 不思議な世界

みんな

www.ehonnavi.net

  • 怖い怖い怖い。ホラー絵本じゃないけど、絵と文章の両方が怖い。
  • この本は小学生以上じゃないとダメだと思う。

せきとりしりとり

www.ehonnavi.net

  • 文章がすばらしい。声に出したいです。

2018/08/16 学習記録

Metabase

  • グラフを書くのに、X軸やY軸を指定していない
  • Revision history機能がある
  • weaks, monthで絞り込める
  • SQLを書く必要がない(SQLに変換してくれる)
  • なぜ地域だと認識できている?

Metabase is an open source business intelligence tool. It lets you ask questions about your data and displays answers in formats that make sense, whether that’s a bar graph or a detailed table.

Your questions can be saved for later, making it easy to come back to them, or you can group questions into great looking dashboards. Metabase also makes it easy to share questions and dashboards with the rest of your team.

To fully understand how to use Metabase, it’s useful to have at least a high level understanding of databases, so we’ll discuss the basics of databases next.

英語

  • aim to : 狙いを定める
  • keep in mind: 心にとめる、肝に銘じる
  • desire: 強く求める
  • all that is needed : 十分である
  • pass list : listを渡す
  • distinct : 明確な
  • temptation: 誘惑
  • obvious: 明らか
  • exhaust: 使い切る
  • Tabular: 表形式
  • take seconds: 数秒かかる
  • rely: 信頼する、当てにする、依存する
  • interpret: 判断する、解釈する
  • arbitary : 任意の
  • concern : 関連する
  • convery: 運ぶ、移す、伝える
  • discreate: 全滅させる
  • as far as : ~する限り
  • bit of : 少しの
  • appropriate: 適用する。
  • concise : 簡潔な
  • awkward : ぎこちない、不器用
  • altitude: 高度
  • sensible :賢明な、思慮のある
  • stuck: 立ち往生
  • tweak : ひねる
  • neat: すっきりした、こぎれいな
  • make sense: 道理にかなう、意味をなす
  • naming convention : 命名規約
  • take a stub : ~を試みる