关于DataLearner - Data Mining Soft
适用于Android的数据挖掘,机器学习和知识发现软件
DataLearner是一个易于使用的工具,可用于从您自己兼容的ARFF和CSV格式的训练数据集中进行数据挖掘和知识发现。它是完全独立的,不需要外部存储或网络连接-它可以直接在手机或平板电脑上构建模型。
>> ARFF和CSV支持<<
训练数据集必须为CSV(逗号分隔的变量)或Weka ARFF格式。
CSV文件必须具有以下功能:
*包含标题行
*类属性最初设置为最后一列
>>将类别属性强制为标称<<
DataLearner的大多数算法都希望使用标称/分类类属性,而使用数字类属性将导致大多数算法失败。新的“标称值的力类属性”功能克服了此问题,但是,标称类属性的不同值太多,可能会占用过多的RAM。
DataLearner具有来自开源Weka(Waikato知识分析环境)软件包的分类,关联和聚类算法,以及查尔斯斯特大学(Charles Sturt University)数据科学研究部门(DSRU)开发的新算法。该应用程序结合在一起提供了42种机器学习/数据挖掘算法,包括RandomForest,C4.5(J48)和NaiveBayes。
DataLearner不会收集任何信息-它仅需要访问设备存储即可加载数据集并建立机器学习模型。
* DataLearner在 ITC573数据和知识工程主题中被用作教学工具查尔斯斯特大学(Charles Sturt University)信息技术硕士学位。
* DataLearner研究在ADMA 2019(第15届高级数据挖掘和应用国际会议)上发表,并发表在``人工智能讲义''(Springer)中
获取资源:
Github上GPL3许可的源代码: https://github.com/darrenyatesau/DataLearner
YouTube上的快速视频: https://youtu.be/H-7pETJZf-g
关于arXiv的研究论文: https://arxiv.org/abs/1906.03773
发起DataLearner的AusDM 2018会议论文: https://www.researchgate.net/publication/331126867
研究人员,如果您在研究应用程序中使用此应用程序,请引用上面的研究论文。谢谢。
机器学习算法包括:
•贝叶斯– BayesNet,NaiveBayes
•功能–物流,SimpleLogistic,多层感知器(神经网络)
•懒惰-IBk(K最近的邻居),KStar
•元– AdaBoostM1,Bagging,LogitBoost,MultiBoostAB,随机委员会,RandomSubSpace,RotationForest
•规则–联合规则,决策表,DTNB,JRip,OneR,PART,Ridor,ZeroR
•树– ADTree,BFTree,DecisionStump,ForestPA,J48(C4.5),LADTree,随机森林,RandomTree,REPTree,SimpleCART,SPAARC和SysFor。
•群集器– DBSCAN,期望最大化(EM),最远优先,FilteredClusterer,SimpleKMeans
•关联– Apriori,FilteredAssociator,FPGrowth
免责声明:本软件按“原样”提供-经过测试,并不暗示或给予任何保证。需要您自担风险使用它。您下载该软件表明您同意这些条款。
最新版本1.1.7的更新日志
* Enabled View Details/Confusion Matrix button after no-CV model build only.
v1.1.6
* Enabled all trees in Random Forest to appear in Confusion Matrix/Model output.
* Added copy-paste to clipboard of Confusion Matrix/Model output.
v1.1.5
* updated error message to suggest using 'Force class attribute to nominal' button on Load screen.
v1.1.4
*fixed introduced bug preventing some statistics from appearing with numeric-class datasets.