隨著大數據時代來臨、無人駕駛和車聯網的快速發展,汽車研發部門需要處理的數據量激增、數據類型不斷擴展。相關數據涵蓋車內高頻CAN 數據和車外ADAS 視頻非結構化數據、位置地理空間數據、車輛運營數據、用戶CRM 數據、WEB 數據、APP 數據、和MES 數據等。
在此背景下,整車廠研發部門關心的是:如何將企業內部的研發、實驗、測試、生產數據,社會用戶的用車數據,互聯網第三方數據等結合起來,將異構數據和同構數據整合到一起,并在此基礎上,實現業務系統、分析系統和服務系統的一體化;怎樣利用深度的駕駛員行為感知、智能的車輛預防性維護、與實時的環境狀態交互,通過大數據與機器學習技術,建立面向業務服務與產品持續優化的車聯網智能分析;利用數據來為產品研發、生產、銷售、售后提供智能決策支撐。這些都是整車廠在大數據時代下亟待解決的問題。
針對這一需求,經緯恒潤探索出以EXCEEDDATA 大數據分析平臺為核心的汽車工程大數據整體解決方案。借助EXCEEDDATA 大數據分析平臺,企業可以集成、處理、分析、以及可視化海量級別的數據,可實現對原始數據的利用,并將原始數據轉化成產品所需的智能,從而改進業務流程、實現智慧決策的產業升級。
產品介紹
? 技術架構
? EXCEEDDATA 采用分布式架構、包含集成處理(ETL)與分析挖掘兩大產品功能體系,共支持20 多個企業常見傳統數據庫和大數據源系統,50 多個分析處理算法、以及豐富的可視化智能展現庫。用戶可以自主的、靈活的將各種來源的原始數據與分析處理串聯應用,建立科學的數據模型,得出預測結果并配以互動的可視化智能,快速的將大數據智能實現至業務應用中。
? 平臺包括分布式大數據分析引擎、智能終端展示、以及API。大數據分析引擎為MPP 架構,建立在開源的Apache Hadoop 與Apache Spark 之上,可簡易的scale-out 擴展。在分析引擎的基礎上包含數據源庫、數據轉換匹配器、數據處理操作庫、機器學習算法庫、可視化圖形庫等子模塊。智能終端展示為行業通用的B/S 架構,用戶通過支持跨操作系統和瀏覽器的HTML5/JS 界面與API 來與平臺互動。
? 廣泛的數據類型和存儲格式支持能力
EXCEEDDATA 平臺支持數值、字符、時間、向量、列表等17 種數據類型,還可支持多種Hadoop 數據存儲格式,如HDFS 的文件存儲格式和Hive 的表存儲格式。為數據分析人員節省大量的數據格式轉換和文件系統轉移的準備時間。分析員可快速的從既有數據源中靈活的獲取數據,盡快開展數據分析任務。
? 豐富的算法模塊和直觀的編程環境
EXCEEDDATA 平臺提供豐富的機器學習算法,共六大類函數對數據進行匯總、分析、分類或聚類,并配以靈活的算法流程引擎和可拉動式界面。業務人員可輕松地選擇和組合多個數據源和算法模塊,快速構建分析流程,對業務進行綜合分析。
機器學習算法包
? 網絡分析類型:Graph Analytics
? 推薦引擎類型:Recommendation Engine
? 時間路徑類別:Time & Path
? 聚類分析類別:Cluster Analytics
? 決策樹分析類型:Decision Tree
? 樸素貝葉斯分析類型:Na?ve Bayes
? 統計分析類別:Statistical Analysis
多維度大數據的分析與預測算法包
? 行為網絡算法, 包括圖譜統計、短路徑等
? 中英文語言分析算法,包括TF-IDF、Word2Vec等
? 地理分析算法
? 分類挖掘:邏輯回歸、向量機、樸素貝葉斯、決策樹、梯度提升決策樹、隨機森林
? 回歸預測:線性回歸、嶺回歸、套索回歸、保序回歸
? 聚類:KMeans 、高斯混合模型
? 關聯推薦:Apriori、FPGrowth、Alternate Least Squares(協同過濾)
? 時間路徑:sessionize、去重、分區、路徑(遍歷、順序、起始點)
? 網絡地理:短路徑、方塊分區索引、異狀邊際定位
? 統計處理:直方分布、密度分布、聚合、排序、過濾等
豐富的數據呈現方式
EXCEEDDATA 平臺提供豐富的數據智能展現,包括折線圖、柱狀圖、餅圖、散點圖、多拿圖、堆疊圖、平行坐標圖等30 多種圖示方式。可幫助業務人員進行多視圖、多層次的分析,挖掘出數據深層次的商業價值,快速發現數據背后的規律。
經緯恒潤
北京市海淀區知春路7號致真大廈D座6層
電話:010-64840808-6105
郵箱:market_dept@hirain.com
網址:www.hirain.com