未経験者がデータサイエンティストとして仕事をもらえたまでの1年間の道のり

データサイエンス
会社の後輩君
会社の後輩君

やっちゃんさん、

データサイエンティストとして

仕事、アサインしてもらえたんすね。

やっちゃん
やっちゃん

ありがたいことに^^。

データサイエンティストと言っていいものなのか、、、

まだまだ駆け出したばっかりだけどね(笑)

メンターというか、OJTの方も傍におるし。

会社の後輩君
会社の後輩君

ふむふむ、でも1年間でそこまでいけるなんていいですね

どんな感じで勉強してきたのか、

差し支えなければ教えてください!

やっちゃん
やっちゃん

2020年3月からPython,Rを用いたデータサイエンスの勉強を始め、

2021年4月に所属組織内にてデータサイエンティストとしての仕事をアサインしていただきました。

生産工場の正常品、異常品をセンサから判別させるシステムの構築です。

データサイエンティストの定義は一概に、これ!と言えるものはありませんし、所属する環境でデータサイエンティストとして仕事をもらえるようになるまでに差はあると思います。あくまで私の所属環境での経験やチャンスをもとに話しますので、ご参考程度に読んでいただけると幸いです^^。



前提として私のこれまでのキャリアや環境

数学や統計的知識

 高校時代は数Ⅲ、数Cまで、大学時代は全微分などもう少し踏み込んだ内容まで履修しました。統計については大学院生の時と現在の職場でExcelや有料の多変量解析ソフトを使ってデータ分析・統計解析をしておりました。その際に必要箇所の統計の勉強をしていたので網羅的に勉強をしたことはありませんでした。当然、統計検定の資格も取得していません(近いうちに取る予定ですが、今年は10月にある別の資格試験に注力しているので、来年にでも)。

PythonやRを用いたデータ解析スキル

 PythonやRの勉強を始めたのは2020年の3月です。先述したように研究職として採用された現在の職場では有料の多変量解析ソフトを使ってデータ分析・多変量解析をすることは頻繁にありました。つまり、有料ソフト内にあるパッケージを用いて、実験で取得したデータを教師なし学習や教師あり学習で解析することはありました。ですので、解析手法の多少の知識などはありました。

職場の環境

 様々な背景を持つ研究者がいます。化学、生物、機械、電気工学、データ科学などなど。ですので、自分が興味がある分野についてどうやって勉強をするべきか迷ったときは、相談できるプロが社内のどこかしらには存在します。ですので勉強のメンターも探しやすい。

 研究・仕事内容についても同様に、化学、生物、機械、電気、データ科学など様々な研究対象があります。ですので、自分のやる気次第で色々な仕事をさせてくれる組織です。会社の事業内容が幅広いので、これまで携わったことのない領域で仕事がしたいと思った場合でも、いきなり転職などはせず、その会社内で異動するなりして仕事をみつけて、ステップアップしていくこともある程度はできるということです。

この一年間での学びの月表

まずは一年の流れをざっと月表でご覧ください。

2020年3月本を用いて独学でPythonの勉強を開始基本構文、
データ加工基礎、
関数など基礎を学ぶ
4~5月本を読んで教師なし、教師ありを独学で学ぶが挫折教師なし
教師あり
6月~10月社内の他部署合同オンライン勉強会メンバーに参加教師なし
教師あり
特徴量エンジニアリング
を学ぶ
9月データサイエンススキルの有用性を上司にアピール
&有料セミナー受講打診
会社に還元できそうなことを
良い感じにプレゼン
11月
~2021年1月

化学×デジタル人材育成講座
(新化学技術推進協会 主催)

データ加工、可視化、
教師あり、教師なし、
畳み込みニューラルネットワーク、
化学構造の取り扱い
データサイエンス活用事例の紹介
2020年12月社内の他部署合同オンライン勉強会
発言力のある先輩とアングラで仕事を進めながら
存在感を出す
自然言語処理(NLP)
部署にデータサイエンススキルをもつ
自分の存在を知らせる
2021年1月社内の他部署合同オンライン勉強会Pycaret、Optuna、転移学習
2月社内の他部署合同オンライン勉強会時系列データの取り扱い
3月社内の他部署合同オンライン勉強会特徴量自動選択、化学構造の取り扱い
4月生産ラインの正常異常を識別するモデル開発者
としてアサイン
データサイエンスの公の初仕事

 こんな感じで一年間過ごしておりました。

本を読んでPythonのなんたるかを独学で勉強(2020.3)

 当時、Pythonを用いたデータサイエンスに興味を持っていましたが、何から勉強を始めればよいのかなあと考えていました。そんな時に私よりも半年近く前にPythonの勉強を始めた同僚に相談し、まずはPythonの基礎の基礎(関数、コンテナ、文字列操作、ループetc.)を学べる本「独学プログラマー Python言語の基本から仕事のやり方まで [ コーリー・アルソフ ]」を紹介してもらいました。


 この本を読んで良かったことは、もちろんPythonの基礎的なプログラミングは学ぶことができますが、それだけではなく、Pythonを使える仕事はデータサイエンスだけではないということを知れたことです。Pythonプラグラミングはスクレイピング、ウェブやモバイル開発、セキュリティやプラットフォーム開発など様々な仕事で活用されていることを知りました。IT分野ど素人の私にとっては衝撃的でした。一つのスキルを身に着けることで様々な仕事に着手できるということは、それだけ仕事を失わなず、守備範囲が広いということになります。昨今のコロナ渦のような先行き不透明な中でも自身の生計を本業でも副業でも支えてくれる心強いスキルだなと勉強を始めた初期に知れたことは非常に大きな学びでした。

本を読んで教師あり、教師なしについて学ぶが挫折(2020.4)

 Pythonの基礎中の基礎を学んだあとは、さあ実践の勉強だ!と次のステージに足を踏み入れました。この時も同僚お墨付きの本「Pythonによる機械学習入門 [ 株式会社システム計画研究所 ]」を紹介してもらいました。楽天等で評価を見ると特に目立った評価はついていませんでしたが、分類、回帰、クラスタリング、画像やセンサの時系列データの取り扱い、データクレンジング、特徴量の導入などデータサイエンスを勉強するうえで基本的な内容を幅広く取り扱ってくれていました。ただ、当時、Jupyter notebookとこの本でデータサイエンスの勉強を進め、知識やデータ解析の流れや雰囲気などの理解が順調であったこととは裏腹に本を使った独学の限界を感じ始めていました。本で一人で勉強をしていると、エラーが生じたときの対処法が全くわからないことばかりなのです。これまで理系研究者としての経験上、わからないことは自分で調べ、実行し、解決する力はあると自負しておりました。研究者もPDCAを回すトライ&エラーの毎日ですからね。プログラミングでもエラーの際は自分で調べ、実行してもエラー、再度調べ、実行してもまたエラーの繰り返しでした。でも結局全くわからん!となることがこれまでの経験よりも圧倒的に多いです。特に勉強し始めの初期は本当にわかりませんでした。解決できたたとしても時間帯効率が悪いことばかり。さすがに心が折れました。勉強のモチベーションも下がりきってました。


社内の多部署合同オンライン勉強会に参加(2020.6)

 モチベーションも下がりきり、これからどうしようか、有料でオンラインセミナーにでも参加してみるか?などと考えていました。しかし、どこの講座が良いのかなどもよくわからず、内容の薄そうなセミナーにお金出したくはないなあと渋っていました。今でこそUdemyProgate、他にも様々な優良なスクールがあることを知り、どれが価値がありそうなセミナーでお金を出すのを惜しむべきではない講座なのかはわかるようになってきましたが、当時情弱だった私は疑心暗鬼状態でした(笑)。今でこそ言えます、Udemy、本当に良いですね(笑)。コスパ良な分かりやすい講座がたくさんあります。

 疑心暗鬼だった私は所属組織内で約一ヵ月近くアンテナを広げていたところ、社内で多部署合同のオンライン勉強会が開かれることを知りました。無料かつ社内の社員が先生をしてくれるという安心感から速攻で参加申請しました(笑)。

 そこでデータの可視化、教師なし(次元削減、クラスタリング)、教師あり(回帰、分類)、特徴量エンジニアリング、欠損値の処理方法などを教えていただき、本では学べなかったエラーの解決方法も学ぶことができました。

やっちゃん
やっちゃん

お金をかけずにここまでの内容を勉強できたのはかなり運が良かったです。

本来なら有料セミナーで勉強するぐらいの内容でした。

皆さんの周りでも会社等で勉強会があれば非常にいいのですが、

もしなければUdemyで探してみるといいです。

セール期間に買えればと破格の値引き価格で受講できます。

私が受けたセミナーでよかったものは、どこかの機会で紹介しようと思います。

スキルの有用性を上司にアピール&化学系有料セミナー受講打診(2020.9)

 いきなりで申し訳ないんですが、言わせてください。勉強するのにお金をかけなければならないのは当たり前ですが、私はあまりお金かけたくないんですw。けち臭いと思われてもいいです(笑)。

 ただ、2020年9月頃の私は有料セミナーを欲してました。これまで社内の勉強会だけだったので他の環境でのコミュニティ作りや社外の他講師からもお話聞いて理解を深めたいなと思っていました。さらに、社内勉強会の講義内容には無かったスキル、化学系の研究者として化学情報をPythonに読み込ませてデータサイエンスをするスキルが欲しいという思いに駆られていました。

 そんな矢先に会社の案内で「化学×デジタル人材育成講座(新化学技術推進協会主催)」という講座案内に出会いました。東大の船津公人 教授と奈良先端技術大の金谷重彦 教授と小野直亮 准教授が講師を務めており、大学では2年近くかけて学ぶ内容を2か月に凝縮させているかなり濃密な講座でした。

 20万円の講座でしたが、日頃勉強していたデータサイエンスのスキルを当時の仕事に活かせるところは活かし、データサイエンススキルの有用性と自己啓発の努力を上司にアピールし、さらには所属部署でどんな仕事をテーマアップできそうかをプレゼンし、セミナーの受講を打診しました。

 その結果、私の上司が理解力のある方というのもあるかもしれませんが、OKをくれました。

やっちゃん
やっちゃん

 日頃から勉強を頑張ってることと、会社にどう還元するかをしっかり考えられてたからこそ自分でお金をかけずに済んだと思っています。会社や上司の気前の良さ、理解の良さにもよるかと思いますが、自分でいきなりどこかの有料セミナーに申し込む前に、会社の上司に会社へのプラスを伝えて会社経費でセミナー受講の許可をもらうのはとてもいいことだと思います。自分でお金をかけずに勉強できるに越したことないです。

 もちろん、セミナー受講後は報告書も書かないといけないし、ちゃんと責任をもってテーマアップしないといけないですが。。。(笑) 社会人として当然ですね。

化学×デジタル人材育成講座に参加(2020.11~2021.1)

 化学×デジタル人材育成講座(新化学技術推進協会主催)に参加しました。詳しくはまた別の記事で紹介したいなと思ってます。

 やっぱり、社内勉強会の講師の人とはまた別の先生の話を聞くっていうのはいいことですね。別の表現や例でこれまで私が学んだことを話してくれたりして、さらに理解が深まります。これまで教わってきた内容を軸にまた新しい内容が枝葉のようにくっついてくれて視野が広がります。

 目的であったPythonやRを用いた化学情報の処理方法についても当然学べましたし、Rを用いた統計解析ついても網羅的に勉強することができました。この記事の前提部分で話しましたが、私の統計知識は虫食い状態でしたので、ここで網羅的に学べたことはかなり大きかったです。近々、統計検定2級はとっておこうかな。

やっちゃん
やっちゃん

反復学習はやっぱり大事ですね。

仕事獲得に向けて発言力のある先輩を味方につけ、存在感を広げる(2020.12)

 化学×デジタル人材育成講座を受講しながらも、仕事に活かせることはないかと毎日目を光らせていました(今もですが)。近い未来、どうやって仕事を獲得するか、自分からテーマアップするにしてもそれが通るかどうかは自分の部署での発言力のレベル(私はただの担当者レベルの若手社員です)や説得力、意義あるテーマかどうかなどの兼ね合いによります。私の所属部署はデータサイエンスに精通している方が少なく、まだまだデータサイエンティストとして駆け出したばかりの私の意見をおいそれと受け入れ、時間、コスト、労力をかける決断を簡単にしてもらえるような環境ではありませんでした。そんな状況を打開する策?として下記のアプローチで攻めていきました。

  • 上司に提案する前に、部内でも発言力がある中堅社員の先輩「優秀マン」に味方になってもらう
  • 優秀マンとアングラテーマを考え、着実に進めながら周りに周知させる
  • やっちゃんも自発的に勉強して頑張ってるし、優秀マンもがやっちゃんを認めて一緒に面白そうなことしてるし、やっちゃんが提案する新たなテーマや新事業を推進してみるかという考えに上司の思考回路をシフトさせる

 当然うまくいくかはわかりませんでしたが、2020.11月下旬にこの考えを実行に移し、運よく、2020.12月上旬に私の上司と一緒に仕事をしている優秀マンと一緒に部内のDXを促進させていこうと意気投合することができました。その後は先述の通り、アングラテーマを二人で考え、着実に仕事を進めていきました。その結果、周りにも少しずつ私のデータサイエンススキルが周知されていったようで、進めているアングラテーマの内容について質問を受けたり、データサイエンスの知識やスキルについて質問されることが増えていきました。「やっちゃんは少なくとも部署内ではデータサイエンスの知識やスキルに長けた人材だ」という認識をしてもらえるようになっているのかな?と自信を獲得すると同時に、身の引き締まる思いを感じるようになっていきました。

やっちゃん
やっちゃん

 実は先輩と意気投合した際には、先輩の方から仕事を一緒にやらないか?とお声をかけていただきました。

 周りから仕事の協業を依頼されたり、質問が増えたりすると信頼されているんだなと嬉しい気持ちになりますよね^^。

データサイエンティストとして仕事をもらう(2021.4)

 優秀マンと仕事を始めて4ヵ月たったころでした。生産工場の正常品、異常品を識別し、異常品を検知するためのシステムを今後を導入していきたいので協業できないかと先方から私の上司に連絡がありました。その結果、喜ばしいことにその仕事に私をアサインしていただくことができました。

やっちゃん
やっちゃん

私からのテーマアップでの仕事ではありませんでしたが、

まずはデータサイエンスを活かせる仕事、データサイエンティストとしてステップアップしていける仕事を一つ頂けたのは私のここ1年の努力を認めてもらえたからこそだと考えています。

 まだまだデータサイエンティストとして未熟もいいところな私ですが、私なりに努力して、環境を利用して、周りの方のご協力をたくさん頂いて、まずは1つ仕事いただき、データサイエンティストとしてのスタート地点に立てたかな?と思っています。

 これからも勉強を重ね、周りの方への協力を頂きながら私なりのキャリアを積んでいきます。

 この記事に記載したPythonやデータサイエンスの勉強の仕方できる限り環境を利用すること、利用できる環境を探すこと、セミナー等で勉強のチャンスを貰えるように上司にプレゼンすること、協力してくれる人探すこと、データサイエンティストとしての仕事をもらうまでの流れなど、これからデータサイエンティストを目指したい方に向けて何か少しでも参考になれば幸いです

一年間で私がしたこと(まとめ)

  • 本を用いて独学で勉強
  • 自分の所属環境で利用できることはないか探して、あれば利用する
  • 自分の努力やデータサイエンスの重要性、会社への還元方法を上司にプレゼンし、セミナーを会社経費で受講する → 実費でもないし、就業時間を自分の市場価値向上の時間にでき一石二鳥
  • 発言力のある優秀マンと意気投合し、一緒に仕事をする
  • 自分のスキルを周りに周知する
やっちゃん
やっちゃん

ご参考になれば幸いです。

これからも精進していきますので、応援よろしくお願いいたします!

何かご質問等ございましたら、お問い合わせフォームよりお待ちしております。



コメント

タイトルとURLをコピーしました