このDataLearner - Data Mining Softについて
Android用データマイニング、機械学習、知識発見ソフトウェア
DataLearnerは、互換性のある独自のARFFおよびCSV形式のトレーニングデータセットからのデータマイニングおよび知識発見のための使いやすいツールです。完全に自己完結型であり、外部ストレージやネットワーク接続を必要としません。スマートフォンやタブレットでモデルを直接構築します。
>> ARFFおよびCSVのサポート<<
トレーニングデータセットは、CSV(カンマ区切り変数)またはWeka ARFF形式である必要があります。
CSVファイルには次の機能が必要です。
*ヘッダー行を含める
*クラス属性は最初に最後の列として設定されます
>>クラス属性をノミナルに強制<<
DataLearnerのアルゴリズムのほとんどは、名義/カテゴリクラス属性を想定しており、数値クラス属性を使用すると、ほとんどのアルゴリズムが失敗します。新しい「ノミナルに対するクラス属性の強制」機能はこれを克服しますが、明確な値が多すぎるノミナルクラス属性はRAMを使い果たす可能性があります。
DataLearnerは、オープンソースのWeka(知識分析用のワイカト環境)パッケージの分類、関連付け、およびクラスタリングアルゴリズムに加えて、Charles Sturt大学のData Science Research Unit(DSRU)によって開発された新しいアルゴリズムを備えています。組み合わせて、このアプリは、RandomForest、C4.5(J48)、およびNaiveBayesを含む42の機械学習/データマイニングアルゴリズムを提供します。
DataLearnerは情報を収集しません。データセットをロードして機械学習モデルを構築するためだけにデバイスストレージにアクセスする必要があります。
* DataLearnerは、 ITC573 Data and Knowledge Engineeringサブジェクトの教育ツールとして使用されています。チャールズ・スタート大学で情報技術の修士号を取得。
* DataLearnerの研究はADMA 2019(高度なデータマイニングとアプリケーションに関する第15回国際会議)で発表され、「人工知能の講義ノート」(Springer)で公開されました。
リソースを取得します。
GithubのGPL3ライセンスのソースコード: https://github.com/darrenyatesau/DataLearner
YouTubeのクイックビデオ: https://youtu.be/H-7pETJZf-g
arXivに関する研究論文: https://arxiv.org/abs/1906.03773
DataLearnerを開始したAusDM 2018カンファレンスペーパー: https://www.researchgate.net/publication/331126867
研究者は、このアプリケーションを研究アプリケーションで使用する場合、上記の研究論文を引用してください。ありがとう。
機械学習アルゴリズムは次のとおりです。
•ベイズ– BayesNet、NaiveBayes
•機能-ロジスティック、SimpleLogistic、MultiLayerPerceptron(ニューラルネットワーク)
•レイジー– IBk(K最近傍)、KStar
•メタ– AdaBoostM1、バギング、LogitBoost、MultiBoostAB、ランダム委員会、RandomSubSpace、RotationForest
•ルール–連言ルール、デシジョンテーブル、DTNB、JRip、OneR、PART、Ridor、ZeroR
•ツリー– ADTree、BFTree、DecisionStump、ForestPA、J48(C4.5)、LADTree、ランダムフォレスト、RandomTree、REPTree、SimpleCART、SPARC、SysFor。
•Clusterers – DBSCAN、期待値最大化(EM)、Farthest-First、FilteredClusterer、SimpleKMeans
•アソシエーション-Apriori、FilteredAssociator、FPGrowth
免責事項:このソフトウェアは「現状のまま」提供されます-テストされている間は、いかなる保証も保証も暗示または提供されません。自己責任で使用してください。このソフトウェアをダウンロードすると、これらの条件に同意したことがわかります。
最新バージョン 1.1.7 の更新情報
* Enabled View Details/Confusion Matrix button after no-CV model build only.
v1.1.6
* Enabled all trees in Random Forest to appear in Confusion Matrix/Model output.
* Added copy-paste to clipboard of Confusion Matrix/Model output.
v1.1.5
* updated error message to suggest using 'Force class attribute to nominal' button on Load screen.
v1.1.4
*fixed introduced bug preventing some statistics from appearing with numeric-class datasets.