华为开发者发布网络人工智能十大(dà)数据集
在华为开发者大(dà)会HDC.Cloud 3月20号直播间,华为(wéi)网(wǎng)络(luò)人工智能数(shù)据湖专家(jiā)周尧,向开发者们正式发布了网络AI领域10大公开数据集(jí),解决了(le)网络(luò)AI开发缺乏工(gōng)业级数据的难题。
这10大数据集是华为(wéi)从外场仿(fǎng)真数据(jù)和实验室(shì)模拟数据,经过解析治理、探索标注之后的,可以直接应用于网络领域AI应用(yòng)开发的数据(jù)集。分为“异常检测类”、“控(kòng)制优化(huà)类”、和(hé)“故(gù)障定界类(lèi)”三大(dà)类:
异常检测类(lèi)
1)性能指标(biāo)异常检测数据集:时(shí)间序列数据(jù)集,包(bāo)括正样本和负样本(běn),可应用于时序序列预(yù)测等算法(fǎ)的训练和验证;样本(běn)量(liàng)100W条,特征维度(dù)7维
2)性能(néng)指标(biāo)变更监控测数据集:覆盖4种网络业(yè)务变更场景(jǐng),包括变更成功场景(jǐng)和失败场景,失败场景数据有对应标(biāo)签;样本(běn)量100W条,特征维度40维
3)硬盘(pán)故(gù)障检(jiǎn)测数据集:覆盖日(rì)立,希捷共计16款硬盘(pán)型号,累积标注坏盘数(shù)量超(chāo)2300块,应用于(yú)硬盘(pán)故障预测(cè)类(lèi)问题分析与研究;样本(běn)量超(chāo)230W条,特(tè)征维(wéi)度超100维(覆盖(gài)厂商公开SMART指标)
控制优化类(lèi)
4)数据中心(xīn)群控(kòng)数据集:包含冷塔(tǎ)、冷机、泵等设备的供回水温度、压力、IT机房(fáng)、冷站设备能耗100+维特征,可应用于(yú)数据(jù)中(zhōng)心(xīn)水(shuǐ)冷冷冻水(shuǐ)场(chǎng)景制(zhì)冷(lěng)系(xì)统优化模型训练;样本量(liàng)2W条,特征维度100维
5)数(shù)据中心PUE优化数据集:覆盖3种制冷场景、4种(zhǒng)末端空调、冷(lěng)站群控、IT机房等设备能耗数据,基于冷却系统完成(chéng)关联,应用(yòng)于PUE优化、网络领域控制类(lèi)模型开发与研究;样本量2W条(tiáo),特(tè)征维(wéi)度110维
故障定(dìng)界类
6)无线接入故障数据集(jí):覆盖20种(zhǒng)无线接入(rù)故(gù)障类(lèi)型,告警数据与工单数据(jù)相关关联,业务专家团队准确(què)标注,可用于(yú)告警压缩和根因定位类模(mó)型开发(fā),样本(běn)量65w条,特(tè)征(zhēng)维度7维
7)无线&IPRAN故障数据集:告警数据基于(yú)无线接入和IPRAN的设备(bèi)拓扑进行关(guān)联,利用工单数据完成根(gēn)因告警标注,覆盖37种故障类型,可用于告警(jǐng)压缩和(hé)故障定位,样(yàng)本(běn)量700w+条,特(tè)征维度24维
8)无线&PTN故障数据(jù)集:告警数(shù)据基(jī)于(yú)无线基站、动力环境、PTN等(děng)设备拓扑进行关(guān)联,利用工单数据完成根因(yīn)告警标注,覆盖48种故障类型,可用于告警压缩和故障定位,样本量100w+条,特(tè)征维度61维
9)无线(xiàn)&微波故障数据集:告警(jǐng)数据基于无线基(jī)站、动力环境、微波等设备拓(tuò)扑进行关联,利用工单数据完成根因(yīn)告警标注,覆盖(gài)29种故障类型,可用于告(gào)警压缩和故障定位,样本量100w+条,特(tè)征维度46维(wéi)
10)PON光路故障数据集(jí):PON光路故障场景数据,包含光纤弯曲、连接器松动等故障场景,覆盖光模块的电压,电流,接收光功率(lǜ),发送光功率等特征,样本量(liàng)4w条,特征(zhēng)维度11维
数据(jù)和特征(zhēng)决定了(le)机器学(xué)习的上(shàng)限,华(huá)为发(fā)布网(wǎng)络(luò)领域(yù)10大(dà)数据集,不但可以(yǐ)帮助网络AI开发者减少90%的数据集准备(bèi)时(shí)间,更重要(yào)的是(shì)将会极大提高(gāo)AI模型精(jīng)度(dù)。目前已验证数据中(zhōng)心数据集助力AI模(mó)型达准确率达到89.77%,无线&IPRAN故(gù)障数据集(jí)提高(gāo)高级聚合率到95.4%,查准率到(dào)90%。
现在(zài)使用华为云(yún)账号登录华为云,选择NAIE服务(路径(jìng):EI企业智(zhì)能—智能体—网络(luò)智能体 NAIE),再从(cóng)AI服务目(mù)录选(xuǎn)择数(shù)据集服(fú)务,即可进入数据集服务(wù)页(yè)面选择所需公开(kāi)数(shù)据(jù)集。