機械学習のためのデータ処理基盤入門 ~ オープンソースで構築できる並列分散処理環境 ~
並列分散処理の主要なOSSである、Spark、hadoop、Cassandraの概要をご紹介する無料セミナーです。 近年、膨大な量のデータが日々生み出されており、さらに今後日本でも5Gなどの導入により入手できるデータ量がさらに増大します。 しかしながら、pythonで処理を行うようなことは、計算時間やリソースなどが大幅にネックとなります。 本セミナーでは、初学者を対象に機械学習のためのデータ処理基盤として、並列分散処理の基礎的な説明から、Spark、hadoop、Cassandraのそれぞれの特徴、処理の動き、導入事例などをご紹介します。 ※弊社INTHEFOREST(インザフォレスト)社は、上記OSS以外にもKafka、NoSQL、k8sなどを組み合わせて超大規模データ基盤の構築・運用を得意としております。 |
■セミナー概要 日 時 | 2019年11月12日(火) 14:30~16:30 (受付開始: 14:15) | 会 場 | 関東IT健康保険組合 大久保健保会館 1F 会議室A 東京都新宿区百人町2-27-6 ・JR総武線「大久保駅」下車 北口改札より徒歩1分 ・JR山手線「新大久保駅」下車 徒歩5分 | 対 象 | 本セミナーは、「機械学習」「データ処理基盤入門」「並列分散処理」に携わる方やこれから携わる予定の技術者向に最適な内容でございます。また、プロポーザルやコンサルティングを担当されておられる方にも有益な内容となっております。 -並列分散処理およびリソース管理に苦慮されている方々 -巨大なデータ基盤構築にご興味がある方々 -今まさにデータシステムで困っている方々 -データ基盤構築/リソース管理に関するリサーチをされている方々 -データシステムに関わる部門に配属を予定されている方々 -プロジェクトがリリースされて一息ついている方々 -上司からITトレンドを調査するように指示されている方々 | 定 員 | 30人 | 費 用 | 本セミナーは無償です。 | 主 催 | コネクト株式会社、株式会社インザフォレスト | ■各セッションの概要 セッション1 | イントロダクション ・データサイズ:ペタバイトの時代(※1 Peta Byte = 1024 Tera Byte) ・並列処理と分散処理 ・(参考)Pythonライブラリ(Numpy・Pandasなど)を利用することの問題点 | セッション2 | 並列分散処理入門 ・Apache Sparkとは? ・Sparkを用いた分散処理(hadoop+Spark) ・分散データベース(Cassandra) ・ユーザ事例:サーバ100台規模の商品レコメンデーションエンジン基盤の構築 | Q&A | | 講師 | 株式会社INTHEFOREST 代表取締役社長 冨田和孝 日本Cassandraコミュニティーメンバー データベースエンジニア・システムアーキテクト ぐるなび、外国為替、ISPなど、DB中心としたシステム構築・運用・保守を担当。 高負荷・大容量・大規模なデータ処理・データ解析基盤作りに強み。 また、学生時代は社会言語学を専攻し、「認知意味論」をベースとしたNLPも研究中。 | セミナー資料 | INTHEFOREST会社紹介 セミナーレジメ | ■ 申し込みページ https://connpass.com/event/152889/ Connpassへジャンプします
|