2021-06-15

【Python】Decimal 型数値の quantize における str 関数の使用上の注意

Abstract

Python の Decimal 型数値を丸める quantize において、quantize のケタ数を指示するための Decimal 型数値の作成に str 関数を使用すると、期待した丸めにならない場合がある。それは、1, 10, …… の位で丸めたい場合である。
str 関数を使わず、クォーテーションで文字列とするのが安全。
また、ある変数を参照して文字列化したものを quantize のケタ数指示に用いる場合は、文字列化の際に、format で有効数字の指定を行うとよい。

Result

例えば、小数第1, 2, ……位で丸めたい場合、以下のように、str 関数を用いても、クォーテーションを用いても、同じ結果が得られる。

>>> decimal.Decimal('562.79').quantize(decimal.Decimal(str(1E-1)), rounding='ROUND_UP')
Decimal('562.8')

>>> decimal.Decimal('562.79').quantize(decimal.Decimal('1E-1'), rounding='ROUND_UP')
Decimal('562.8')

しかし、1, 10, ……の位で丸めたい場合、str 関数を用いると所望の結果は得られず、クォーテーションを用いると所望の結果が得られる。

>>> decimal.Decimal('562.79').quantize(decimal.Decimal(str(1E0)), rounding='ROUND_UP')
Decimal('562.8')

>>> decimal.Decimal('562.79').quantize(decimal.Decimal('1E0'), rounding='ROUND_UP')
Decimal('563')

>>> decimal.Decimal('562.79').quantize(decimal.Decimal(str(1E1)), rounding='ROUND_UP')
Decimal('562.8')

>>> decimal.Decimal('562.79').quantize(decimal.Decimal('1E1'), rounding='ROUND_UP')
Decimal('570')

これは、str 関数を用いたときと、クォーテーションを用いたときとで、内部での扱われ方が異なるため。
DecimalTuple(sign, digittuple, exponent) を比較すると、以下のようになっている。

>>> decimal.Decimal(str(1E1)).as_tuple()
DecimalTuple(sign=0, digits=(1, 0, 0), exponent=-1)

>>> decimal.Decimal('1E1').as_tuple()
DecimalTuple(sign=0, digits=(1,), exponent=1)

>>> decimal.Decimal(str(1E0)).as_tuple()
DecimalTuple(sign=0, digits=(1, 0), exponent=-1)

>>> decimal.Decimal('1E0').as_tuple()
DecimalTuple(sign=0, digits=(1,), exponent=0)

なお、1E-1以下では、どちらでも同じ扱われ方になっている。

>>> decimal.Decimal(str(1E-1)).as_tuple()
DecimalTuple(sign=0, digits=(1,), exponent=-1)

>>> decimal.Decimal('1E-1').as_tuple()
DecimalTuple(sign=0, digits=(1,), exponent=-1)

変数を受け取って、その変数に基づき quantize のケタを指示したい場合は、format において有効数字を 1 ケタにするとよい。そうすると、所望の結果が得られる。

>>> a = 1E2                                                                                                                                                                                      
>>> decimal.Decimal('562.79').quantize(decimal.Decimal('{:.1g}'.format(a)), rounding = 'ROUND_UP')                                                                                               
Decimal('6E+2')

>>> b = 1E1                                                                                                                                                                                      
>>> decimal.Decimal('562.79').quantize(decimal.Decimal('{:.1g}'.format(b)), rounding = 'ROUND_UP')                                                                                               
Decimal('5.7E+2')

>>> c = 1E0
>>> decimal.Decimal('562.79').quantize(decimal.Decimal('{:.1g}'.format(c)), rounding = 'ROUND_UP')                                                                                               
Decimal('563')

>>> d = 1E-1
>>> decimal.Decimal('562.79').quantize(decimal.Decimal('{:.1g}'.format(d)), rounding = 'ROUND_UP')                                                                                               
Decimal('562.8')

Reference

docs.python.org
osaru.netlify.app
note.nkmk.me

2020-03-04

電気学会論文誌のフォント

書き散らかしたもの

Abstract

電気学会論文誌の和文フォントには、モリサワ製品のリュウミンLightが使われている。したがって、電気学会から提供されているTeXテンプレートをコンパイルして得られるpdfのフォントと一致しないのは無理もない話であり、その点を悩む必要はない。

はじめに

電気学会から提供されているTeXテンプレートをコンパイルして得られるpdfの和文フォントが、電気学会論文誌の論文の和文フォントと異なっていることに気づき、そこから小一時間悩んでしまった。

フォントの差異の検証

f:id:calpeace:20200304175125p:plain — Fig.1 (a)手元環境でコンパイルしたもの　　　　　　(b)公開されている論文誌

f:id:calpeace:20200304175143p:plain — Fig.1 (a)手元環境でコンパイルしたもの　　　　　　(b)公開されている論文誌

Fig.1(a)に、手元環境でコンパイルし得られたpdfの拡大画像を、Fig.1(b)に、公開されている論文誌の拡大画像を、それぞれ示す。拡大してみると、微妙にフォントが異なっていることがわかる。

f:id:calpeace:20200304181115p:plain — Fig.2 (a)手元環境で得たpdfのフォント　　　(b)電気学会論文誌のpdfのフォント

f:id:calpeace:20200304181128p:plain — Fig.2 (a)手元環境で得たpdfのフォント　　　(b)電気学会論文誌のpdfのフォント

Fig.2(a)に、手元環境で得たpdfのフォントを、Fig.2(b)に、電気学会論文誌のpdfのフォントを、それぞれ示す。手元環境では、IPA明朝・IPAゴシックが用いられている。一方、電気学会論文誌では、リュウミンLightが用いられていることがわかる。

リュウミンはモリサワ社のフォント製品である。以下、製品の特徴を同社HP（https://www.morisawa.co.jp/fonts/specimen/1314）より引用する。

「リュウミン」は、その名の元となった森川龍文堂明朝体をベースに開発した、スタンダードな明朝体です。金属活字に由来する彫刻刀の冴えを、左右のハライや点の形に活かしながらも、縦画・横画の先端やウロコにはやわらかさをもたせており、親しみやすい雰囲気になっています。特に、均整のとれた流れるような表情の美しさには定評があり、本文組みから見出しまでDTPの基本書体として幅広く使用されています。

論文提出時にはプリインストールされたフォントを用いて問題なく、採択された場合には、課金フォントで組版された論文が仕上がるものと考えられる。

おわりに

モリモリ執筆していきましょう。

2019-12-03

院試の余熱で資格試験

資格・検定書き散らかしたもの

これは eeic （東京大学工学部電気電子・電子情報工学科） Advent Calendar 2019 - Qiita の 3 日目の記事です。

2 日目: segfaultさん

情報熱力学入門：情報理論のその先へ - non-equilibrium

4 日目: ずんずんさん

ｽﾞﾝ生観 - acryloshobonileのブログ

1. はじめに
2. なぜ院試後に資格試験？
3. 応用情報技術者試験 (AP) 受験記
4. おわりに
追記

1. はじめに

　はじめましてのひとははじめまして、eeic B4 のかるぴすと申します。タイトルの通りの話をします。

　前半では、なぜわざわざ院試後に資格試験？について書きます。後半では、この秋受けた応用情報技術者試験の受験記を書きます(まだ結果が出ていないのですが)。

　アドベントカレンダーの前菜として、適当に読んでいただければ。

2. なぜ院試後に資格試験？

　まだ院試を受けていない方々には申し訳ないのですが、院試は想像以上につらい。もう 2 度とやらんというお気持ちになります。そのうえでさらに試験を受けようとするのは、ある種修行のように思われるかもしれません。

　ですが、あえてこの記事では、院試直後だからこそ、その余熱を活かして勢いで試験を受けちゃえばいいのでは？という提案をしたいと思います。以下、一般的な理由から、eeic 特有の理由まで、順に述べていきます。

2.1 秋は資格の季節らしい

　このあたり( 各種資格試験日カレンダー|資格の講座(社会人講座)|＜資格の大原＞ ), ( 資格カレンダー - 2020年10月 - 資格の王道 )をご覧いただくとわかるように、秋は様々な資格試験が行われます。春は年度初めで慌ただしく、冬は天候による交通支障が懸念される、といった理由から秋に集中するものと思われます。

　ですので、院試を終えて1, 2か月後というのが、様々な試験を受けるのにちょうどよいタイミングとなります。かなり難しい試験を受ける場合は措くとして、1, 2か月あればある程度の試験には備えることができそうな気がしませんか……？

　以下、eeic に関連しそうなものをいくつか取り上げます。ものによっては年に複数回試験があるものもありますが、9 ～ 12月に絞って記載しました。試験日など、詳しく正確な情報を知りたい場合は HP を見てください。

電気主任技術者 (8, 9月)
一般財団法人電気技術者試験センター
　いわゆる電験。一種～三種があるが、一種はおそらく仕事で電力系に携わっているひとでないと受からないのでは……？二種、三種は院試専門科目に関連しているので、法規以外は院試勉強と兼ねることができるかもしれない。
基本情報技術者、応用情報技術者、各種スペシャリスト試験 (10月)
IPA 独立行政法人情報処理推進機構：情報処理技術者試験・情報処理安全確保支援士試験
　eeic の情報系の授業と関連が深いので、院試後から対策を始めても受けやすい。基本情報・応用情報は各分野まんべんなく出題され、スペシャリスト試験ではさらに各分野に特化した問題が出題される。情報という名を冠しているが、後半の体験記でも述べるように、応用情報までなら電電でも十分対応できると思う。
数学検定 (10月)
実用数学技能検定（数学検定・算数検定）｜公益財団法人日本数学検定協会
　院試数学を活かすなら。1 級が大学での微積・線形・基礎統計に対応している。
統計検定 (11月)
統計検定：Japan Statistical Society Certificate
　データサイエンス、機械学習が流行る時代だからこそ、統計の理論を知っておくのは良さそう。2 級は駒場の基礎統計程度。準1級(春のみ)は 2 級に加えて応用的トピックに関する理解が問われる。1 級は数理統計に関する理論と応用を問われる。院試が終わってから対策を始めるなら 2 級が無難そう(計数の授業などを取っていたひとはいきなり 1 級でもいけるのかもしれない)。
TOEIC (9,10,11,12月)
【公式】TOEIC Program｜IIBC
　資格試験とはちょっとテイストが異なるが、院試で英語の勘を取り戻して受けてみるのはよいかも。日本企業の就活にはいまだに使われているようですし……。

2.2 "受験勉強"の習慣を活かす

　普段の定期試験であれば、持ち込み資料を作ることができたり、過去問を活用することができたりするので、それほど時間をかけない(かけられない)場合が多いかと思います。

　ですが、院試はさすがにそうはいかないので、多くのひとは、院試前 1 か月くらいは学科の授業の復習や試験の解き直しなどの "受験勉強" をします。電車内でも、普段なら Twitter を眺めて過ごすところを、参考書を読んだりすることもあるかもしれません。

　そのようにして取り戻した "受験勉強" の習慣を、院試が終わったあとも続けたら、さいきょーになれると思いませんか？ 100 % 続けるのは他のタスクの都合上難しいかもしれませんが、0 % にしないだけでも効果はあるはずです。

2.3 院試直後に研究のことだけ考えるのはしんどい

　これは eeic 特有の問題かもしれませんが、弊学科では院試終了後 2 週間で卒論の中間報告書を提出し、さらに中間発表に向け準備しなければなりません。多くのひとは院試前 1 か月くらいは研究から離れていますので、院試終了直後からモリモリ研究するのはブランクの影響もありなかなか難しいところがあります。締め切りに追われる焦燥感のなか、研究だけに集中してもよいのですが、研究に慣れていない学部生が四六時中研究のことだけ考えていても、焦りが募る、考えがまとまらない、などの症状が起き、非効率この上ありません。

　そこで、逆転の発想として、1 日のなかで研究以外のタスクに費やす時間を確保してみるのです。そうすると、気分転換になりますし、限られた時間で仕上げようとすることで、かえってうまくいく場合が往々にしてあります。受験勉強でも、同じ科目をずっとやっているよりは、科目を変えてみたり、場所を変えてみたり、といった気分転換が効果をもたらすことがあります。この研究以外のタスクとして、資格の勉強を入れてみるとよいのでは？というのがここでの提案です。

2.4 申込の注意

　2.1 節で例示した試験のなかには、申込期限が院試前に設定されているものがありますので、院試後に何らかの試験を受けようとする場合、受けたい試験の申込期限には注意しましょう。

3. 応用情報技術者試験 (AP) 受験記

　後半では、実際に筆者がこの秋に受けた応用情報技術者試験(以下 AP と記す)について書いていきます。これを書いている時点では、合格発表がされていないので、あまり偉そうなことは書けないのですが、何らかの参考になれば幸いです。

　試験の概要は以下の通りです。

分野
テクノロジ (技術全般。セキュリティとかデータベースとか)
ストラテジ (経営戦略や法務)
マネジメント (プロジェクトの管理、サービスの管理)
形式
午前・4 者択一式 80 問。6 割以上で合格。
午後・記述式 11 問から 5 問選択。セキュリティは必答。6 割以上で合格。
時間
午前、午後とも 150 分

3.1 動機

　筆者は電気電子工学科の電力系コースに所属しており、2A セメスターでは、ディジタル回路や情報通信理論といった情報系の授業もとりあえず履修しましたが、3S セメスター以降、電情のひとたちが履修するような授業を履修せずに過ごしてきました。

　院試の季節になり、院試の問題について相談する電情のひとびとを見るにつれ、彼らが今までどんな授業を受けてきたのか、その一端でもよいから知りたいというお気持ちがわいてきました。そこで、情報系の知識全般を問う AP に目をつけ、試験ドリブンでざっくりと勉強してみるかと思い立ちました。

3.2 参考書など

　ここでは、試験を受けるまでに利用した参考書やサイトを紹介します。

a) キタミ式イラストIT塾応用情報技術者
　試験範囲の概要を理解するのにかなり役立つ。ゆるふわな感じで解説が進むので、院試直後のちょっと疲れた状態でもモリモリ読み進めることができる。これで全体像をつかめばあとは問題演習。レビューの中には「これに載っていない内容も出題される！」といったものが散見されるが、試験範囲すべてを事細かに記載するような参考書はたいてい途中で読むのがしんどくなるので、これくらいでちょうどいい。kindle 版があるので持ち運びに便利なのもよい。

キタミ式イラストIT塾応用情報技術者平成31/01年 (情報処理技術者試験)

作者:きたみりゅうじ
出版社/メーカー: 技術評論社
発売日: 2018/12/14
メディア: 単行本（ソフトカバー）

b) 応用情報技術者午後問題の重点対策
　午前の試験問題は 4 者択一のマーク式ですが、午後問題は記述式問題になります。問題の中からヒントとなる部分を読み取って、指定された形式で解答する必要があります。解答の書き方を読むだけでも参考になります。ただし、紙媒体のみなので、持ち運びはやや不便。

2019応用情報技術者午後問題の重点対策 (重点対策シリーズ)

作者:小口達夫
出版社/メーカー: アイテック
発売日: 2018/10/31
メディア: 単行本（ソフトカバー）

c) 応用情報技術者過去問道場
応用情報技術者過去問道場｜応用情報技術者試験.com
　控えめに言っても神。現在の試験形式になってからのすべての問題を出題してくれる。午前問題の対策は、ひたすらこれを解けば十分。

3.3 時系列

8月上旬
院試終わったら何をしようか考える。なんとなく、資格を取ってみるのもいいかと思いはじめる。電情のひとが AP を取っていたのを思い出す。
「AP って前提知識なくてもいけるか？」的なツイートをしたら、学科民から「へーきへーき！」といった趣旨のリプライをもらった記憶がある。
8月中旬
受験申込締め切りが近かったので勢いで申し込む。
8/28
院試終了。キタミ式の kindle 版を購入。
以後通学時などに読み進める。
9月中旬
キタミ式読了。午後問題対策を購入。過去問道場を開始。
以後通学時は過去問道場を解く。
10月上旬
午後問題対策を過去問道場と並行して進める。あまり捗らなかった。
10月中旬
過去問道場の解答数が 1,000 を突破。午前はいけるやんという気持ちになる。
10/20
試験本番。電車の便が悪いところに飛ばされる。
午前は公式の解答が出たので自己採(64/80)。OK！
午後は記述式で自己採できないので放置。今日に至る。

3.4 感想

　概要を把握するのにキタミ式の参考書がかなり役立った。午前問題については過去問過学習でかなり伸びた。午後問題は出たとこ勝負感があってなんとも言い難いが、通っててほしい。
　これだけで情報を応用できる人材には到底なれない気がするが、電情のひとたちが授業でやってきた内容に少し触れることができたように思う。また、意外とストラテジ・マネジメント分野の内容が興味深かった。IT 人材はプログラムを書くだけでなくプロジェクトをマネジメントする必要もあるんだなあと思った。

4. おわりに

　資格を持っていることが、その分野の知識を習得していることを保証するか？と問われると、そうは言いきれない面もあります。しかし、資格を取ろうと勉強することでふんわりと身についた "知識の取っ掛かり" はどこかで役に立つはずです。大学を出た後も知識のアップデートをしていくための手段のひとつとして、資格試験の利用に目を向けてみるのもアリかなと感じた次第です。

追記

　受かってました、わいわい！ f:id:calpeace:20200108005012j:plain

2019-06-11

VSCode で LaTeX を使う (Windows)

やったこと環境構築/導入

はじめに

　VSCode 上で LaTeX を使えるようにするまでの流れのメモ。Windows 環境。2020/03/18 加筆修正

1. TeX自体の準備：TeX Live のインストール

　TeX Live/Windows - TeX Wiki に詳述されている。Installing TeX Live over the Internet - TeX Users Group から install-tl-windows.exe を入手し、インストールを行う。インストール時間は本体の性能に依存するようで、1時間程度で済む場合から10時間くらいかかる場合まで…。

2. VSCode側の準備

LaTeX Workshop のインストール

　VSCode の拡張機能から LaTeX Workshop を検索しインストールする。

settings.json の編集

　本項は以下の記事を参考にしている。

　VSCode の settings.json 内に、ツール・レシピ・オプションを記載することで、VSCode からコンパイルを行うことができる。ツールは、コンパイルのための具体的なコマンドを記載したもの。レシピは、ツールの使用順番を記載したもの。レシピを用意することで、コンパイルを一気通貫に行うことができる。

　bibtex の有無、参照(figure など)の有無に応じて、6 通りのレシピを用意した。platex / uplatex のそれぞれについて、bibtex も参照もないもの用 (nobib/noref)、bibtex はないが参照はあるもの用 (nobib/ref)、bibtex も参照もあるもの用 (bib/ref) のレシピがある。

　以下に settings.json の中身を示す。

{
    "editor.wordSeparators": "./\\()\"'-:,.;<>~!@#$%^&*|+=[]{}`~?　、。「」【】『』（）！？てにをはがのともへでや",
  
    // latex-workshop.latex.tools: Tool の定義
    "latex-workshop.latex.tools": [
        {
            "command": "ptex2pdf",
            "args": [
                "-l",
                "-ot",
                "-kanji=utf8 -synctex=1",
                "-interaction=nonstopmode",
                "%DOC%"
            ],
            "name": "ptex2pdf (platex)"
        },
        {
            "command": "ptex2pdf",
            "args": [
                "-l",
                "-u",
                "-ot",
                "-kanji=utf8 -synctex=1",
                "-interaction=nonstopmode",
                "%DOC%"
            ],
            "name": "ptex2pdf (uplatex)"
        },
        {
            "command": "pbibtex",
            "args": [
                "%DOCFILE%",
                "-kanji=utf8"
            ],
            "name": "pbibtex"
        },
        {
            "command": "upbibtex",
            "args": [
                "%DOCFILE%",
                "-kanji=utf8"
            ],
            "name": "upbibtex"
        }
    ],
  
    // latex-workshop.latex.recipes: recipeの定義
    "latex-workshop.latex.recipes": [
        {
            "name": "bib/ref (uplatex)",
            "tools": [
                "ptex2pdf (uplatex)",
                "upbibtex",
                "ptex2pdf (uplatex)",
                "ptex2pdf (uplatex)"
            ]
        },
        {
            "name": "bib/ref (platex)",
            "tools": [
                "ptex2pdf (platex)",
                "pbibtex",
                "ptex2pdf (platex)",
                "ptex2pdf (platex)"
            ]
        },
        {
            "name": "nobib/ref (uplatex)",
            "tools": [
                "ptex2pdf (uplatex)",
                "ptex2pdf (uplatex)"
            ]
            },
        {
            "name": "nobib/ref (platex)",
            "tools": [
                "ptex2pdf (platex)",
                "ptex2pdf (platex)"
            ]
        },
        {
            "name": "nobib/noref (uplatex)",
            "tools": [
                "ptex2pdf (uplatex)"
            ]
        },
        {
            "name": "nobib/noref (platex)",
            "tools": [
                "ptex2pdf (platex)"
            ]
        }         
    ],
  
    "latex-workshop.latex.clean.fileTypes": [
        "*.aux", "*.bbl", "*.blg", "*.idx", "*.ind", "*.lof", "*.lot", "*.out", "*.toc", "*.acn", "*.acr", "*.alg", "*.glg", "*.glo", "*.gls", "*.ist", "*.fls", "*.log", "*.fdb_latexmk", "*.synctex.gz", "_minted*", "*.nav", "*.snm", "*.vrb",
    ],
  
    "latex-workshop.view.pdf.viewer": "tab",
    "latex-workshop.latex.autoBuild.run": "never",
    "latex-workshop.latex.autoClean.run": "onBuilt"
}

　以下にオプションの説明を示す。

文法ミスが存在するとコンパイルが終わらない場合がある。コンパイルに失敗してもひとまず終了するよう、 "-interaction=nonstopmode" をコマンドの引数に加える。
editor.wordSeparators は区切り文字の指示。
latex-workshop.latex.clean.fileTypes はコンパイル中に生まれる中間ファイルの消去対象の指示。
latex-workshop.view.pdf.viewer はできた pdf の表示ツールの指示。tab にすれば VSCode 上で確認できる。
latex-workshop.latex.autoBuild.run はセーブしたときに自動でコンパイルするか否かの指示。onFileChange にするとセーブしたとき自動でコンパイルされるが、煩わしければ never にする。
latex-workshop.latex.autoClean.run は中間ファイルの自動消去をいつ行うかの指示。onBuild にするとコンパイルの成否にかかわらず消去を行う。onFailed にするとコンパイルに失敗した時だけ消去を行う。never は自動消去を行わない。

2019-04-22

Windows への MinGW を利用した C/C++ 環境構築

環境構築/導入やったこと

以下の記事を参考にする。

lyncs.hateblo.jp

webkaru.net

ただし、上記記事の MinGW インストールボタンが現在は見当たらないので、以下のリンクからインストーラを入手して行う。

Downloading File /68260/mingw-get-setup.exe - MinGW - Minimalist GNU for Windows - OSDN

2019-03-07

「Python機械学習プログラミング達人データサイエンティストによる理論と実践」を読んだ [読書ログ]

Python 読書ログ

・書名

「Python 機械学習プログラミング達人データサイエンティストによる理論と実践」(インプレス/Sebastian Raschka 著/株式会社クイープ訳/福島真太朗監訳)

book.impress.co.jp

・動機/経緯

機械学習の"き"の字も知らないのはまずいだろうということで、衝動買いした一冊(中古で買ったらあとで新版があることに気づいた(初版と第2版の違いについては後述))。

しばらく積みっぱなしにしていたが、春休みを得たので少しずつ読み進め、ひとまず最後まで到達した。

・読者(わたし)のスペック(読前)

・機械学習は全く知らない

・Pythonを触ったことがある。Jupyter Notebookも使ったことがある。

・大学初年度程度の微積分、線形代数、最適化手法の知識(おきもち程度)

・読み方

本書にあげられているコードは、すべて筆者のgithub(GitHub - rasbt/python-machine-learning-book: The "Python Machine Learning (1st edition)" book code repository and info resource)から入手できる。ipynb形式なので、Jupyter Notebook上ですぐに実行できる。最初はコードを手打ちで写経していたが、これの存在に気づいてからはここからコードを入手して手元で動かしながら読み進めた。

以下は訳者の方の読み方ガイド。読み進める順番、必要な知識、読了後に読むとよい他書籍などが紹介されている。

thinkit.co.jp

・内容

章立ては以下のようになっている。新版では、13章以降が増強され、初版では概要を述べるにとどめられていたCNNやRNNについて実装まで紹介されている。また、それ以外の章についても増補されているため、今から買うなら新版(第2版)がよいと思う。とはいえ、初版でもそれぞれの手法についてよくまとまっている。

・第1章「データから学習する能力」をコンピュータに与える

・第2章分類問題 -- 機械学習アルゴリズムのトレーニング

・第3章分類問題 -- 機械学習ライブラリscikit-learnの活用

・第4章データ前処理 -- よりよいトレーニングセットの構築

・第5章次元削減でデータを圧縮する

・第6章モデル評価とハイパーパラメータのチューニングのベストプラクティス

・第7章アンサンブル学習 -- 異なるモデルの組み合わせ

・第8章機械学習の適用1 -- 感情分析

・第9章機械学習の適用2 -- Webアプリケーション

・第10章回帰分析 -- 連続値をとる目的変数の予測

・第11章クラスタ分析 -- ラベルなしデータの分析

・第12章ニューラルネットワーク -- 画像認識トレーニング

・第13章ニューラルネットワーク -- 数値計算ライブラリTheanoによるトレーニングの並列化

・感想

・理論と実践とはいうものの、実践がメイン

各章では、まず理論や定義を述べてから実装や実践例が紹介されていく。ただ、読みやすさのためか、理論といってもイチから導出していくわけではなく、「このような考え方があります。このような変形が成り立ち、最終的にうれしい結果が得られるので、これを使っていきましょう」といった流れ(伝わるのか…?)。また、数式に頼らずに、手法の気持ちを説明しているところもあり、個人的には結構わかりやすかった。

理論をイチからやりたいなら、他の書籍を読む必要がある。ただ、モリモリ読み進めるには、理論と実装の配分はこれくらいがちょうどよいと思う。