実証講座

 

■日 程:
2019年11月21日(木)9:20~16:30
2019年11月22日(金)9:20~16:30

■会 場:
日本電子専門学校 7号館711教室
住所:〒169-0074 東京都新宿区北新宿1丁目4−2
URL :https://www.jec.ac.jp/access/

■対象者:
専門学校学生(AIシステム科 2年次)   

■目 標:
IT技術者に必要なデータ分析のための基本的なスキルの習得を目標とする。
IT技術者に必要なデータ分析のための基本的スキルを習得する。
統計解析とは、機械学習とは何かなどの基本的な知識と、実施にツールやライブラリを利用したデータ分析を実施することで、実践的なデータ分析のスキルを習得する。

■参加者:
49名(AIシステム科、2年次)

■スケジュール:

○1日目【11月21日(木)】

時間 内容
9:00

【講座概要の説明】

[データ活用概論]
データ分析とは?
データ分析に関わる重要キーワードの解説
キーワード1:ビッグデータ
キーワード2:統計
キーワード3:データサイエンティスト
キーワード4:人工知能
キーワード5:機械学習
キーワード6:深層学習

[演習課題]

データ分析ソフトウェアの紹介と分析環境の構築
分析環境の概要
分析環境のプログラミング言語やライブラリ紹介
Python
Jupyter
Pandas
Scipy
Statsmodels
NumPy
matplotlib
scikit-learn

12:00 昼休
13:00

【Python】

[Pythonの基礎文法]
四則演算
文字列
変数
リスト
制御構文
if文による条件分岐処理
for文によるループ処理
関数

[演習課題]

[Pythonの応用文法]
リスト型
タプル型
集合型
辞書型
ファイルの入出力
モジュール

【Pythonによるデータ分析】

[Numpy基礎]
Numpyとは?
Numpyのデータ構造:ndarray
ndarrayに関する基本的な操作

[Pandas基礎]
Pandasとは?
Pandasのデータ構造:Series, DataFrame
Pandasに関する基本的な操作

【データの可視化】

[データの可視化とは?]
matplotlib
グラフ描画の基本
折れ線グラフ
散布図
ヒストグラム
タイトルを表示
表示幅の変更
複数のグラフの描画
グラフを別々に描画し、1つの図とする方法
クラスを利用した描画方法
2つのグラフで軸を揃えて描画
凡例をつける方法

16:00 終了

○2日目【11月22日(金)】

時間 内容
9:00

【統計解析全体像】

[統計解析とは?]
データから「事実を正しく語る」ことについて
統計という道具を使う
データ収集
記述統計
推定
仮説検定
相関
回帰
標本抽出
区間推定と信頼区間
母平均算出の例
検定、確率分布
t検定
カイ二乗分布

[演習問題]

[相関について]
相関関係と因果関係
2変数の相関関係
相関係数
散布図によるプロット
2変数以上の相関関係
相関行列

[回帰 / 回帰分析とは?]
線形回帰、非線形回帰
最小二乗法
Pythonによる最小二乗法の実行
最小二乗法による回帰の例
線形回帰
非線形回帰
演習問題

12:00 昼休
13:00

【機械学習全体像】

[機械学習とは?]
機械学習で使われる用語の整理
機械学習の処理の流れ
データの入手
データの前処理
機械学習の手法選択
パラメータの選択
モデルの学習
モデルの評価
チューニング

[データセットについて]
一般的なscikit-learnの処理の流れ
教師あり学習の代表的な手法
k近傍法
SVM
精度向上のための工夫
パラメータチューニング
グリッドサーチ
交差検定法
結果の評価

[演習問題]

[教師なし学習とは?]
教師なし学習の代表的な手法について
クラスタリング
k-means
次元削減
主成分分析

[演習問題]

【大規模データ処理】

[大規模データとは?]
Hadoopの基礎知識
SparkとHadoop
Spark自体の歴史
Sparkの基本アイデアと実行環境

[演習問題]

16:00 終了

 

機械学習・データマイニング実証講座

 

■日 程:
2019年12月25日(水)9:00~17:00

■会 場:
日本電子専門学校 7号館711教室
住所:〒169-0074 東京都新宿区北新宿1丁目4−2
URL :https://www.jec.ac.jp/access/

■対象者:
情報系専門学校教員   

■目 標:
T技術者に必要なデータ分析のための基本的スキルを習得する。
統計解析とは、機械学習とは何かなどの基本的な知識と、実施にツールやライブラリを利 用したデータ分析を学習し、実践的なデータ分析を理解する。
データマイニングの考え方、手法の理解をする。

■参加要件:本講座の内容は、受講者が以下の知識・技術を有していることを前提としている

○機械学習について
技術要件
・mac/windowsの操作をしたことがある。mac操作の経験があることが好ましい
・macにおけるターミナルの操作、windowsにおけるコマンドプロンプトの操作ができる
・pythonでファイル操作、四則演算など簡単な処理が実装できること

数学の知識
・数に関する基本事項(算術演算、べき乗、階乗、約数・倍数、数の偶奇、素数、など)を学習していること
・合計、平均、標準偏差など基本的な統計処理を理解していること

言葉に対する知識
・データサイエンス、ビッグデータ、機械学習、AIなど、データ分析に関わる種々のキーワードを知っていること

○データマイニングについて
※上記「機械学習」の要件は満たしている前提で、以下のスキルも必要となる

技術要件
・scikit-learnなどのライブラリを駆使したpythonプログラミングができること
・何らかの機械学習器を実装したことがあること
・データセットを学習データとテストデータに分け、学習データでモデルを作成し、テストデータで精度を確認するなど、基本的な機械学習のプロセスを遂行できること。
・プログラミング実行中にエラーが発生した際に、webの情報などを元に自身でエラーを解消できること。

数学の知識
・行列計算を理解していること。

言葉に対する知識
・分類、回帰、クラスタリング、次元削減など基本的な用語を知っていること

■参加者:
15名

■スケジュール:

○【12月25日(水)】

時間 内容
9:00

【オリエンテーション】

【講座概要の説明】

[データマイニング導入]
データマイニングとは
データマイニングの手法の分類
クラス分類
回帰
クラスタリング
パターン抽出
その他の手法
データマイニングの歴史と発展

[Pythonの基礎文法]
四則演算
文字列
変数
リスト
制御構文
if文による条件分岐処理
for文によるループ処理
関数

[演習課題]

[Pythonの応用文法]
リスト型
タプル型
集合型
辞書型
ファイルの入出力
モジュール

【統計解析全体像】

[統計解析とは?]
データから「事実を正しく語る」ことについて
統計という道具を使う
データ収集
記述統計
推定
仮説検定
相関
回帰
標本抽出
区間推定と信頼区間
母平均算出の例
検定、確率分布
t検定
カイ二乗分布

[演習問題]

[相関について]
相関関係と因果関係
2変数の相関関係
相関係数
散布図によるプロット

12:00 昼休
13:00

【機械学習全体像】

[機械学習とは?]

[機械学習で使われる用語の整理]

[機械学習の処理の流れ]
データの入手
データの前処理
機械学習の手法選択
パラメータの選択
モデルの学習
モデルの評価
チューニング

[決定木(演習)]
決定木による発話の分類

[線形回帰(演習)]
線形回帰モデルの構築

[主成分分析(演習)]
主成分分析アルゴリズムの実装

17:00 終了