History

leestott eaff2e5814 🌐 Update translations via Co-op Translator		2 weeks ago
..
README.md	🌐 Update translations via Co-op Translator	2 weeks ago
assignment.md	🌐 Update translations via Co-op Translator	3 weeks ago

後書き: 実世界における機械学習

スケッチノート: Tomomi Imura

このカリキュラムでは、データをトレーニング用に準備し、機械学習モデルを作成するさまざまな方法を学びました。回帰、クラスタリング、分類、自然言語処理、時系列モデルといった一連の古典的なモデルを構築しましたね。おめでとうございます！さて、これらのモデルが実際にどのように役立つのか気になりませんか？実世界での応用例はどのようなものなのでしょうか？

業界では通常ディープラーニングを活用するAIが注目されていますが、古典的な機械学習モデルにも価値ある応用例が存在します。実際に、今日すでにこれらの応用例を利用しているかもしれません。このレッスンでは、8つの異なる業界や専門分野がこれらのモデルを活用して、アプリケーションをより高性能で信頼性が高く、知的で価値あるものにしている方法を探ります。

💰 金融

金融業界は機械学習を活用する多くの機会を提供しています。この分野の多くの問題は、機械学習を使用してモデル化し解決するのに適しています。

クレジットカード不正検出

コースの初期にk-meansクラスタリングについて学びましたが、これをクレジットカード不正に関連する問題の解決にどのように活用できるでしょうか？

k-meansクラスタリングは、外れ値検出と呼ばれるクレジットカード不正検出技術で役立ちます。外れ値、つまりデータセットの観測値の逸脱は、クレジットカードが通常の使用状況であるか、何か異常が発生しているかを示すことができます。以下の論文で示されているように、k-meansクラスタリングアルゴリズムを使用してクレジットカードデータを分類し、各取引を外れ値の程度に基づいてクラスタに割り当てることができます。その後、最もリスクの高いクラスタを評価し、不正取引か正当な取引かを判断します。参考文献

資産管理

資産管理では、個人や企業が顧客の代わりに投資を管理します。彼らの仕事は長期的に資産を維持し成長させることであり、良好なパフォーマンスを示す投資を選ぶことが重要です。

特定の投資がどのようにパフォーマンスを示すかを評価する方法の一つが統計的回帰です。線形回帰は、ファンドがベンチマークに対してどのようにパフォーマンスを示すかを理解するための貴重なツールです。また、回帰の結果が統計的に有意であるかどうか、つまり顧客の投資にどの程度影響を与えるかを推測することもできます。さらに、複数回帰を使用して分析を拡張し、追加のリスク要因を考慮することも可能です。特定のファンドに対してこれがどのように機能するかの例については、以下の論文をご覧ください。参考文献

🎓 教育

教育分野も機械学習が適用できる非常に興味深い領域です。試験やエッセイでの不正行為の検出や、意図的でない場合も含めた採点プロセスのバイアス管理など、興味深い問題があります。

学生行動の予測

オンラインオープンコースプロバイダーのCourseraは、多くのエンジニアリング決定について議論する素晴らしい技術ブログを持っています。このケーススタディでは、低いNPS（Net Promoter Score）評価とコースの継続率や離脱率との相関を探るために回帰線をプロットしました。参考文献

バイアスの軽減

スペルや文法エラーをチェックするライティングアシスタントGrammarlyは、製品全体で高度な自然言語処理システムを使用しています。彼らは、機械学習におけるジェンダーバイアスにどのように対処したかについて、技術ブログで興味深いケーススタディを公開しました。この内容は、公平性に関する導入レッスンで学んだ内容と関連しています。参考文献

👜 小売

小売業界は、顧客体験の向上から在庫管理の最適化まで、機械学習の恩恵を受けることができます。

顧客体験のパーソナライズ

家具などの家庭用品を販売するWayfairでは、顧客が自分の好みやニーズに合った商品を見つけることが重要です。この記事では、同社のエンジニアが機械学習と自然言語処理を使用して「顧客に適切な結果を提示する」方法について説明しています。特に、彼らのQuery Intent Engineは、エンティティ抽出、分類器トレーニング、資産と意見の抽出、顧客レビューの感情タグ付けを使用しています。これは、オンライン小売における自然言語処理の典型的な使用例です。参考文献

在庫管理

StitchFixのような革新的で機敏な企業は、推薦や在庫管理に機械学習を大いに活用しています。彼らのスタイリングチームは、商品チームと協力しています。「あるデータサイエンティストが遺伝的アルゴリズムをいじり、それをアパレルに適用して、今日存在しない成功する服を予測しました。それを商品チームに持ち込み、彼らはそれをツールとして使用できるようになりました。」参考文献

🏥 医療

医療分野では、研究タスクの最適化や患者の再入院管理、病気の拡散防止といった物流問題に機械学習を活用できます。

臨床試験の管理

臨床試験における毒性は製薬会社にとって大きな懸念事項です。どの程度の毒性が許容されるのでしょうか？この研究では、さまざまな臨床試験方法を分析し、臨床試験結果の確率を予測する新しいアプローチを開発しました。具体的には、ランダムフォレストを使用して分類器を作成し、薬剤グループを区別することができました。参考文献

病院の再入院管理

病院でのケアは費用がかかり、特に患者が再入院する場合はさらに高額になります。この論文では、クラスタリングアルゴリズムを使用して再入院の可能性を予測する企業について議論しています。これらのクラスタは、分析者が「共通の原因を共有している可能性のある再入院グループを発見する」助けとなります。参考文献

病気の管理

最近のパンデミックは、機械学習が病気の拡散を防ぐのに役立つ方法に注目を集めました。この論文では、ARIMA、ロジスティック曲線、線形回帰、SARIMAの使用例が紹介されています。「この研究は、このウイルスの拡散率を計算し、死亡者数、回復者数、確認された症例を予測する試みであり、より良い準備をして生き残る助けとなることを目指しています。」参考文献

🌲 生態学とグリーンテクノロジー

自然と生態学は、動物と自然の相互作用が焦点となる多くの繊細なシステムで構成されています。これらのシステムを正確に測定し、森林火災や動物の個体数減少などの問題が発生した場合に適切に対応することが重要です。

森林管理

以前のレッスンで強化学習について学びましたが、これは自然のパターンを予測する際に非常に役立ちます。特に、森林火災や外来種の拡散といった生態学的問題を追跡するために使用できます。カナダでは、研究者グループが衛星画像を使用して森林火災の動態モデルを構築するために強化学習を使用しました。革新的な「空間的拡散プロセス（SSP）」を使用して、森林火災を「景観内の任意のセルでのエージェント」として想定しました。「火災が任意の時点で特定の場所から取ることができる行動のセットには、北、南、東、西への拡散や拡散しないことが含まれます。」

このアプローチは通常のRLセットアップを逆転させます。対応するマルコフ決定プロセス（MDP）の動態は、即時の火災拡散に関する既知の関数であるためです。以下のリンクで、このグループが使用した古典的なアルゴリズムについて詳しく読むことができます。参考文献

動物の動きのモーションセンサー

深層学習は動物の動きを視覚的に追跡する革命をもたらしましたが（ホッキョクグマトラッカーを自分で構築できます）、古典的な機械学習もこのタスクで役割を果たしています。

農場動物の動きを追跡するセンサーやIoTはこの種の視覚処理を利用しますが、より基本的な機械学習技術はデータの前処理に役立ちます。例えば、この論文では、羊の姿勢をさまざまな分類器アルゴリズムを使用して監視し分析しました。ページ335にROC曲線が掲載されています。参考文献

⚡️ エネルギー管理

時系列予測のレッスンでは、供給と需要を理解することで町の収益を生み出すスマート駐車メーターの概念を取り上げました。この論文では、クラスタリング、回帰、時系列予測を組み合わせて、スマートメーターを基にしたアイルランドの将来のエネルギー使用量を予測する方法について詳しく説明しています。参考文献

💼 保険

保険業界は、実行可能な財務および保険数理モデルを構築し最適化するために機械学習を活用しています。

ボラティリティ管理

生命保険プロバイダーのMetLifeは、財務モデルにおけるボラティリティを分析し軽減する方法について率直に説明しています。この論文では、二値分類および順序分類の可視化が見られます。また、予測の可視化も発見できます。参考文献

🎨 芸術、文化、文学

芸術分野、例えばジャーナリズムでは、多くの興味深い問題があります。フェイクニュースの検出は大きな問題であり、人々の意見に影響を与えたり、民主主義を崩壊させたりすることが証明されています。博物館も、アーティファクト間のリンクを見つけたり、リソース計画を行ったりする際に機械学習の恩恵を受けることができます。

フェイクニュース検出

今日のメディアでは、フェイクニュースの検出は猫とネズミのゲームのようになっています。この論文では、学んだ機械学習技術を組み合わせたシステムをテストし、最適なモデルを展開することを提案しています。「このシステムは、データから特徴を抽出するための自然言語処理に基づいており、これらの特徴はNaive Bayes、Support Vector Machine (SVM)、Random Forest (RF)、Stochastic Gradient Descent (SGD)、Logistic Regression (LR)などの機械学習分類器のトレーニングに使用されます。」参考文献

この論文は、異なる機械学習分野を組み合わせることで、フェイクニュースの拡散を防ぎ、実際の被害を防ぐ興味深い結果を生み出す方法を示しています。この場合、COVID治療に関する噂の拡散が暴力的な暴動を引き起こしたことがきっかけでした。

博物館の機械学習

博物館は、コレクションのカタログ化やデジタル化、アーティファクト間のリンクを見つける技術が進歩するにつれて、AI革命の最前線に立っています。In Codice Ratioのようなプロジェクトは、バチカンのアーカイブのようなアクセス困難なコレクションの謎を解き明かすのに役立っています。しかし、博物館のビジネス面も機械学習モデルの恩恵を受けています。

例えば、シカゴ美術館は、観客が何に興味を持ち、いつ展示会に訪れるかを予測するモデルを構築しました。目標は、ユーザーが博物館を訪れるたびに個別化され最適化された体験を提供することです。「2017年度中、モデルは入場者数と入場料を1％以内の精度で予測しました」とAndrew Simnick氏（シカゴ美術館の上級副社長）は述べています。参考文献

🏷 マーケティング

顧客セグメンテーション

最も効果的なマーケティング戦略は、さまざまなグループに基づいて顧客を異なる方法でターゲットにします。この論文では、差別

講義後のクイズ

復習と自己学習

Wayfairのデータサイエンスチームは、会社でどのように機械学習を活用しているかについての興味深い動画をいくつか公開しています。ぜひチェックしてみてください!

課題

機械学習スカベンジャーハント

免責事項:
この文書は、AI翻訳サービス Co-op Translator を使用して翻訳されています。正確性を期すよう努めておりますが、自動翻訳には誤りや不正確な部分が含まれる可能性があります。元の言語で記載された原文が正式な情報源と見なされるべきです。重要な情報については、専門の人間による翻訳を推奨します。本翻訳の利用に起因する誤解や誤認について、当社は一切の責任を負いません。

README.md

Unescape Escape

後書き: 実世界における機械学習

講義前クイズ

💰 金融

クレジットカード不正検出

資産管理

🎓 教育

学生行動の予測

バイアスの軽減

👜 小売

顧客体験のパーソナライズ

在庫管理

🏥 医療

臨床試験の管理

病院の再入院管理

病気の管理

🌲 生態学とグリーンテクノロジー

森林管理

動物の動きのモーションセンサー

⚡️ エネルギー管理

💼 保険

ボラティリティ管理

🎨 芸術、文化、文学

フェイクニュース検出

博物館の機械学習

🏷 マーケティング

顧客セグメンテーション

講義後のクイズ

復習と自己学習

課題

README.md Unescape Escape

後書き: 実世界における機械学習

講義前クイズ

💰 金融

クレジットカード不正検出

資産管理

🎓 教育

学生行動の予測

バイアスの軽減

👜 小売

顧客体験のパーソナライズ

在庫管理

🏥 医療

臨床試験の管理

病院の再入院管理

病気の管理

🌲 生態学とグリーンテクノロジー

森林管理

動物の動きのモーションセンサー

⚡️ エネルギー管理

💼 保険

ボラティリティ管理

🎨 芸術、文化、文学

フェイクニュース検出

博物館の機械学習

🏷 マーケティング

顧客セグメンテーション

講義後のクイズ

復習と自己学習

課題

README.md

Unescape Escape