ことさら−古都プログラマーの更級日記

京都でお寺を回りながら御朱印集めをしていたエンジニアのブログ。おもに技術的なはなしとか日常的なはなし。たまにカメラの話や競馬の話も書きます。

PyCon1日目メモ

強くなるためのコンテスト @cocodrips

発表者

くーむ@( o・ω・)ノ (@cocodrips) | Twitter

スライド

www.slideshare.net

主なサイトとか

  • Algorythm
  • Game AI Contest
    • Codingame
  • Data Mining
    • Kaggle
  • Server
    • ISUCON *CTF
    • SECCON
    • ksnctf

セキュリティコンテストチャレンジブック -CTFで学ぼう! 情報を守るための戦い方-

セキュリティコンテストチャレンジブック -CTFで学ぼう! 情報を守るための戦い方-

そういえばこれもまだ買ってなかった

プログラミングコンテスト攻略のためのアルゴリズムとデータ構造

プログラミングコンテスト攻略のためのアルゴリズムとデータ構造

Pythonと型ヒント @t2y

要約

  • type hint は Python 3 でのみ
  • Python 3.0 で関数アノテーションを PEP 484 でこれを型アノテーションに限定
  • mypy-project というものがある
    • pypyがライバル
    • PEP 484 のベースで、mypyがPEP 484で標準化
    • PEP 484 は type hint の仕様を定義しただけ
    • 実装はサードパーティ
  • でも結局型ヒント書くの大変だしチェック長いし><

タイプヒント書き方の例

def func(data: Dict[str, Any]) -> str:

感想

  • こんなのあったのか!
  • 片付け言語じゃだめなんですか><
    • 使ってみるとなるほど!ってなるらしい
    • 自分もPHPでtype hint使ってるから何も言えないけど

Webフロントのテスト

ツイート関連文書判定

Elasticsearch と日本語

  • kuromoji plugin
  • MeCabはまだ対応していない
    • ipadicの制度に依存する
  • N-Gram
    • 2-Gramは制度がいいが、インデックスが肥大化しやすい
    • 3-Gramだと意味のある言葉を取りこぼす...

Tokenize

  • wikipediaからMecabユーザー辞書の作成
    • が、コストをうまく調整しないと、変なキーワードが抽出される
    • mecab dic over drice (Perlで作ってある)
    • python で頑張って実装してます><
  • 品詞連結で未知語に対応
    • 言選ロジック

Sphinxと翻訳

スライド

www.slideshare.net

インストール(pip install)

  • sphinx-intl
  • transifex-client=0.8

sphinxi18n

  • potファイルの生成
  • poファイルの読み込み
  • htmlに

  • Drone.io

LT

感想

会場狭い><