konekto,Inc.　コネクト株式会社

HOME

事業情報

ニュース

イベント/セミナー

[11/12]機械学習のためのデータ処理基盤入門

機械学習のためのデータ処理基盤入門
～オープンソースで構築できる並列分散処理環境～

並列分散処理の主要なOSSである、Spark、hadoop、Cassandraの概要をご紹介する無料セミナーです。
近年、膨大な量のデータが日々生み出されており、さらに今後日本でも５Gなどの導入により入手できるデータ量がさらに増大します。しかしながら、pythonで処理を行うようなことは、計算時間やリソースなどが大幅にネックとなります。
本セミナーでは、初学者を対象に機械学習のためのデータ処理基盤として、並列分散処理の基礎的な説明から、Spark、hadoop、Cassandraのそれぞれの特徴、処理の動き、導入事例などをご紹介します。

※弊社INTHEFOREST（インザフォレスト）社は、上記OSS以外にもKafka、NoSQL、k8sなどを組み合わせて超大規模データ基盤の構築・運用を得意としております。

■セミナー概要

日　時	2019年11月12日(火) 14:30～16:30 （受付開始: 14:15）
会　場	関東IT健康保険組合大久保健保会館１Ｆ会議室A 東京都新宿区百人町2-27-6 ・JR総武線「大久保駅」下車北口改札より徒歩1分・JR山手線「新大久保駅」下車徒歩5分
対　象	本セミナーは、「機械学習」「データ処理基盤入門」「並列分散処理」に携わる方やこれから携わる予定の技術者向に最適な内容でございます。また、プロポーザルやコンサルティングを担当されておられる方にも有益な内容となっております。 -並列分散処理およびリソース管理に苦慮されている方々 -巨大なデータ基盤構築にご興味がある方々 -今まさにデータシステムで困っている方々 -データ基盤構築/リソース管理に関するリサーチをされている方々 -データシステムに関わる部門に配属を予定されている方々 -プロジェクトがリリースされて一息ついている方々 -上司からITトレンドを調査するように指示されている方々
定　員	30人
費　用	本セミナーは無償です。
主　催	コネクト株式会社、株式会社インザフォレスト

■各セッションの概要

セッション１	イントロダクション・データサイズ：ペタバイトの時代（※1 Peta Byte = 1024 Tera Byte）・並列処理と分散処理・（参考）Pythonライブラリ（Numpy・Pandasなど）を利用することの問題点
セッション２	並列分散処理入門・Apache Sparkとは？・Sparkを用いた分散処理（hadoop+Spark）・分散データベース（Cassandra）・ユーザ事例：サーバ100台規模の商品レコメンデーションエンジン基盤の構築
Q＆A
講師	株式会社INTHEFOREST　代表取締役社長　冨田和孝日本Cassandraコミュニティーメンバーデータベースエンジニア・システムアーキテクトぐるなび、外国為替、ISPなど、DB中心としたシステム構築・運用・保守を担当。高負荷・大容量・大規模なデータ処理・データ解析基盤作りに強み。また、学生時代は社会言語学を専攻し、「認知意味論」をベースとしたＮＬＰも研究中。
セミナー資料	INTHEFOREST会社紹介セミナーレジメ