大(dà)数据(big data)是指无法在一定时间(jiān)范围(wéi)内用常规(guī)软件(jiàn)工具进行捕捉(zhuō)、管理和处理的数据集合,是需要新处理模(mó)式才能具(jù)有更强的决策力、洞察发现力和流(liú)程(chéng)优化能力的海量、高增长率和多样化的信(xìn)息资产。
在维克托(tuō)·迈尔-舍恩伯格(gé)及肯尼斯·库克耶编写(xiě)的《大数据时代》中大数据指不(bú)用随机分(fèn)析法(抽样调查)这样捷径,而采用所(suǒ)有数据进行(háng)分析处理。大(dà)数据的5V特点(IBM提(tí)出):Volume(大量)、Velocity(高(gāo)速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
大数(shù)据(jù)技术的(de)战略意(yì)义不在于掌(zhǎng)握庞(páng)大的数据信息,而在于对这些含有意义的数据进行(háng)专业化(huà)处理(lǐ)。换(huàn)言之,如果把大数据比作一种产业,那么这种产业实现盈利的关(guān)键(jiàn),在(zài)于(yú)提高对数据(jù)的“加工能力”,通过“加(jiā)工”实现(xiàn)数据的“增值”。
大(dà)数(shù)据涉及到(dào)的学科:计算机,信息科学,统计学(xué)等。