支持關(guān)系型數(shù)據(jù)庫(kù)、文件(txt/CSV/Excel/JSON…)、分布式大數(shù)據(jù)框架(HDFS/HBASE/HIVE…)以及通過(guò)集成第三方數(shù)據(jù)讀取方法支持諸如時(shí)間序列、web數(shù)據(jù)、圖數(shù)據(jù)等多種類型的數(shù)據(jù)源,方便企業(yè)各類數(shù)據(jù)的接入,為數(shù)據(jù)分析提供豐富的數(shù)據(jù)源
提供豐富的數(shù)據(jù)探查與圖形化展示功能,包括數(shù)據(jù)取值分布、集中趨勢(shì)度量、離散程度度量、偏態(tài)峰態(tài)度量、空值探查等。通過(guò)參數(shù)化配置支持?jǐn)?shù)據(jù)分區(qū),如訓(xùn)練集校驗(yàn)集劃分,統(tǒng)計(jì)抽樣等。提供數(shù)據(jù)項(xiàng)的各種預(yù)處理功能,如行過(guò)濾、行轉(zhuǎn)化、列過(guò)濾、列轉(zhuǎn)化、數(shù)據(jù)聚合和分組、數(shù)據(jù)分箱、shuffle、sorter、標(biāo)準(zhǔn)化、子集匹配、表維度提取、表規(guī)格提取、表轉(zhuǎn)置等。通過(guò)接入其他語(yǔ)言(Python/R/JAVA…)代碼模塊支持用戶自定義的各種數(shù)據(jù)預(yù)處理功能
提供各種數(shù)據(jù)統(tǒng)計(jì)分析功能,包括基本數(shù)據(jù)統(tǒng)計(jì)、相關(guān)性分析、方差分析、相似度統(tǒng)計(jì)、參數(shù)估計(jì)、假設(shè)檢驗(yàn)、主成分及因子分析、時(shí)間序列分析等。提供各種統(tǒng)計(jì)圖表的數(shù)據(jù)可視化及配色定義等自定義功能,包括高亮表、箱型圖、柱狀圖、折線圖、餅圖、散點(diǎn)圖、提升圖等,支持通過(guò)接入第三方圖形化插件擴(kuò)展數(shù)據(jù)可視化圖表類別
提供各種數(shù)據(jù)挖掘功能。包括:回歸分析,如線性回歸、對(duì)率回歸、多元回歸、逐步回歸、嶺回歸、Lasso回歸等。分類,如貝葉斯分類、決策樹(shù)分類、SVM分類、RF分類、GBDT、AdaBoost、Bagging分類、線性判別分類、K近鄰分類、XGBoost等。聚類,如K-Means、DBSCAN、層次聚類等。頻繁模式挖掘,如Apriori、FPGrowth等。推薦,如協(xié)同過(guò)濾、序列分析等
通過(guò)定義人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)提供各種深度學(xué)習(xí)功能。包括:CNN、DNN、RNN、LSTM等
通過(guò)模型評(píng)估工具,用戶可以對(duì)開(kāi)發(fā)的數(shù)據(jù)分析模型的模型效果進(jìn)行衡量。評(píng)估功能包括:交叉驗(yàn)證、ROC曲線、熵值計(jì)分器、數(shù)值計(jì)分器、濃縮繪圖儀等。支持接入第三方代碼模塊擴(kuò)展模型評(píng)估方法
提供豐富的數(shù)據(jù)分析結(jié)果輸出功能,支持平臺(tái)分析結(jié)果輸出到目標(biāo)對(duì)象,如文件、數(shù)據(jù)庫(kù)、分布式大數(shù)據(jù)框架等。提供模型導(dǎo)出功能,支持平臺(tái)構(gòu)建的數(shù)據(jù)分析流程或模型能夠通過(guò)第三方語(yǔ)言(Python/R/JAVA…)等調(diào)用。提供數(shù)據(jù)分析處理流程的流程控制工具,包括自動(dòng)化執(zhí)行、循環(huán)、開(kāi)關(guān)、錯(cuò)誤處理等,方便用戶開(kāi)發(fā)的數(shù)據(jù)分析模型部署應(yīng)用到實(shí)際生產(chǎn)場(chǎng)景中
平臺(tái)提供與其他平臺(tái)、框架的集成接口,方便集成其他平臺(tái)、語(yǔ)言及框架。具體包括:分析處理平臺(tái)集成,如weka、MATLAB、SAS、SPSS等。語(yǔ)言集成,如R、Python、JAVA等。分布式大數(shù)據(jù)框架集成,如Hadoop、spark、kerberos等。機(jī)器學(xué)習(xí)深度學(xué)習(xí)框架集成,如SK-Learn、TensorFlow等
不論是導(dǎo)入數(shù)據(jù)、構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),還是制作各類分析展現(xiàn)、數(shù)據(jù)挖掘等,設(shè)計(jì)過(guò)程完全可視化。遵循便捷易用的設(shè)計(jì)理念,所有操作無(wú)需定義復(fù)雜公式,僅需拖拉拽即可快速完成設(shè)計(jì),零門檻、上手快。內(nèi)置上百種可視化元素和統(tǒng)計(jì)圖,通過(guò)設(shè)計(jì)與搭配,可衍生出成千上萬(wàn)種可視化效果。同時(shí)還支持動(dòng)態(tài)炫酷的大屏分析,獨(dú)特的3D全景視角,自由快捷制作各類交互式常規(guī)屏和大屏報(bào)表,將創(chuàng)意變成現(xiàn)實(shí)
平臺(tái)支持?jǐn)?shù)據(jù)庫(kù)數(shù)據(jù)源、文本數(shù)據(jù)源等多種數(shù)據(jù)源的接入,僅需簡(jiǎn)單的拖拽操作便可快速設(shè)計(jì)復(fù)雜格式的報(bào)表,報(bào)表支持餅圖、折線圖等多種圖形展示并提供報(bào)表預(yù)覽功能,支持報(bào)表導(dǎo)出PDF、EXCEL、WORD等格式
行政執(zhí)法案件主要以罰款等方式進(jìn)行行政處罰,處罰決定當(dāng)事人拒不執(zhí)行時(shí)需要進(jìn)行強(qiáng)制執(zhí)行。通過(guò)數(shù)據(jù)分析手段分析何種案件當(dāng)事人較為配合能夠執(zhí)行處罰決定,何種案件容易導(dǎo)致當(dāng)事人拒不執(zhí)行處罰決定需要被強(qiáng)制執(zhí)行
強(qiáng)制執(zhí)行處罰決定的行政執(zhí)法案件,一方面有可能是由于當(dāng)事人的原因?qū)е?,可以進(jìn)一步尋找“老賴”當(dāng)事人或其特征;另一方面有可能是由于案件執(zhí)法原因?qū)е?,如處罰決定不合理,當(dāng)事人對(duì)處罰決定不滿等,可以進(jìn)一步進(jìn)行行政執(zhí)法監(jiān)督分析;此外,在執(zhí)法過(guò)程中,可以通過(guò)模型進(jìn)行處罰決定執(zhí)行情況預(yù)測(cè),為處罰裁量提供參考依據(jù)
行政管理部門的管理職權(quán)及其對(duì)應(yīng)的案件根據(jù)業(yè)務(wù)特點(diǎn)可能呈現(xiàn)一些特征規(guī)律,如季節(jié)性因素等。通過(guò)數(shù)據(jù)分析找出案件發(fā)生數(shù)量的規(guī)律并能夠?qū)ξ磥?lái)案件可能發(fā)生的數(shù)量進(jìn)行預(yù)測(cè)
行政執(zhí)法案件的來(lái)源除了群眾舉報(bào)外,主要依靠管理部門的例行檢查發(fā)現(xiàn)。較為準(zhǔn)確的預(yù)測(cè)未來(lái)案件可能發(fā)生的數(shù)量,能夠?yàn)橹朴喐鼮楹侠淼臋z查計(jì)劃,更合理的配置檢查力量提供參考依據(jù)
對(duì)低保家庭是否能夠生活自理進(jìn)行統(tǒng)計(jì)分析。低保家庭是否能夠生活自理統(tǒng)計(jì)分析一方面能夠?yàn)槊裾I(yè)務(wù)辦理及管理提供當(dāng)前低保家庭生活自理狀況的宏觀情況;另一方面能夠?yàn)檫M(jìn)一步的數(shù)據(jù)分析,如退保情況和生活自理情況關(guān)聯(lián)分析提供依據(jù)