大数据的来源非常广泛,主要包括以下几个方面:
互联网和物联网设备
互联网公司在其核心业务领域(如搜索、社交、媒体、交易)产生大量数据。
物联网设备持续采集数据,设备数量和数据量持续增长。
企业和政府
企业内部数据,如交易数据、移动通信数据、人为数据、机器和传感器数据等。
政府部门的数据资源。
数据类型
交易数据,包括POS机数据、信用卡刷卡数据、电子商务数据等。

人为数据,如电子邮件、文档、图片、音频、视频以及社交媒体产生的数据流。
机器和传感器数据,如感应器、量表和其他设施的数据、GPS系统数据等。
其他来源
传统企业的内部数据,如销售、客服、仓储、财务等。
第三方数据,如广告供应商、新媒体、H5、app等传播与媒体数据。
公共领域数据资源。
大数据具有4V特性:体量大(Volume)、多样性(Variety)、价值密度低(Value)、快速化(Velocity)。这些数据集合因其规模巨大、多样化和高复杂度,需要通过新的处理模式来发挥其决策支持、洞察发现力和流程优化能力
