更多 选择语言
< 返回主菜单
PG电子·(中国)官方网站 PG电子·(中国)官方网站

pg电子官网NF5568M4助力猿题库深度学习应用

客户信息

猿题库
网站:http://www.yuantiku.com/
组织规模:
行业:

摘要

项目配景

  pg电子官网倚天系列产品NF5568M4基于最新Intel Haswell EP-2600V3平台,用于构建面向GPU异构超算、Intel MIC微异构盘算及NVidia Grid虚拟事情站解决计划 。   pg电子官网倚天超算提供优异的盘算性能、稳定的可靠性以及超高 IO 扩展能力, 适用于生命科学、数据剖析、金融盘算、量化盘算、石油能源、气候气象、工程科学、可视化、互联网深度学习、机械学习等应用领域,以及高端虚拟事情站应用 。

  项目剖析

  猿题库是中国首个智能在线题库效劳提供商,基于大数据应用的在线教育平台 。

  2013年2月,在线教育平台粉笔网推出新产品猿题库(yuantiku.com),猿题库提供了一个革命性的学习产品 。提供历年考试最权威真题供考生练习,还能凭据考生的水平一对一智能出题考生只要在猿题库上开始答题练习,系统就会清晰的告诉他目今的能力水平、他的薄弱考点有哪些、如果加入今年考试预计能得几多分以及接下来需要 做什么题目 。相关于古板的温习备考,这种在线智能做题的备考方法将大幅提升温习效率和效果 。

  这是猿题库基于大数据的剖析及人工智能算法等多项专利技术而实现的 。

  业务应用

  猿题库需要采购高性能,高效,稳定的效劳器,可以提供高性能的并行盘算能力,作为其深度学习模型训练和人工智能应用的焦点IT硬件 。猿题库深度学习训练和应用模型主要分为两种:卷积神经网络模型和递归神经网络模型,这两种神经网络法都是参考人类神经网络的仿生学盘算要领,将大宗的数据源通过神经网络法盘算之后获得切合需求的模型为最终的使用提供效劳 。

  在模型训练及应用阶段面临大宗的技术问题的挑战,总结下来至少有以下几个方面:

  1)每天千万张级别的图片搜索请求;

  2)每天十个亿级别的ORC识别(将图像转换为盘算机文字的历程);

  3)数理化庞至公式的识别

  4)手写内容识别

  5)模糊/扭曲/明暗图片问题的修正

  关于图像转换为文字的历程或许分为:图像预处理,图像切分,匹配,纠错和搜索 。关于这几个问题里最大的挑战在于手写内容的识别和庞至公式的识别 。

  由于每个人的手写习惯差别,识别手写体成为了图像预处理和切分之后首先要面临的挑战,通过大宗的样本找到手写习惯的配合特征,如习惯向右倾斜着写或者中文之间没有空格等 。

  然而不管是在基础教育阶段,照旧高等教育阶段,数学总是让人觉得永无止境的难度学科 。所以,在搜题请求里,有凌驾一半的搜索请求都是与数学有关,这就意味着有大宗的庞至公式需要识别,好比根号,、分式、上下标的种种组合 。这不但要进行正确的切分,还需要有合理的匹配识别 。

计划概述

详细解决计划

  凭据对客户需求的剖析,为了实现并行盘算的高性能、高可靠、高可用的特性,提高深度模型逊з、效果和线上效劳的稳定可靠,降低日常运维本钱,我们接纳NF5568M4作为其人工智能应用的基础硬件平台 。NF5568M4是专为盘算而设计的超算效劳器,最大化精简了不须要的功效,并针对高性能并行盘算增加相应的功效和优化,为用户提供了更为稳定、可靠的盘算平台 。

  产品优势:

  (1)支持GPGPU异构盘算架构

  倚天超算引入GPU盘算单位,突破了简单CPU盘算单位的限制,接纳Intel最新Haswell处理器与NVIDIA GPU加速盘算技术的协同,CPU和GPU协同盘算,CPU主要担负越发擅长的逻辑选择、判断跳转和IO通信方面的职责,而GPU则专职盘算密集型、高度并行的盘算事情,使得盘算资源合理的分派,盘算力被充分释放,盘算性能抵达从几倍到几百倍的增长.

  (2)支持Intel MIC微异构

  倚天超算引入MIC微异构盘算单位,微异构盘算单位坚持了与CPU编程的最大复用.至强处理器是古板多焦点CPU,而至强融核协处理器MIC则拥有众多的微内核,这些内核与CPU拥有相同的x86架构,可以在相同的编程情况下,甚至险些不必改动原有代码就可以在系统上顺利运行.

  (3)支持基于Grid技术的虚拟事情站

  倚天超算是构建高性能虚拟事情站的基础平台,将Nvidia Grid技术、虚拟桌面技术完美融合于pg电子官网倚天产品,给桌面提供专业的图形盘算支持,并通过云端随时随地无缝地提供应任意设备,用户不但得以充分体验宁静、可治理、灵活的虚拟化优势,更能尊享媲美外地体验的互动性能.

  (4)协调解理单位间高速IO交换技术

  pg电子官网倚天为加速卡提供高速PCI-E3.0连接, 确保所有板卡在全速IO速率运行.相关于古板PCI总线在简单时间周期内只能实现单向传输,PCI-E的双单工连接能提供更高的传输速率和质量,它们之间的差别与半双工和全双工类似.pg电子官网倚天接纳了PCI-E 3.0 x16,带宽抵达32GB/s.

  (5)接纳Intel最新的QPI技术

  为了更好的发挥CPU和GPU的协同效应,pg电子官网“倚天”桌面超等盘算机接纳了Intel 公司的QPI(Quick Path Interconnect)技术,最大可以实现高达9.6GT/s的传输速率,使通信越发迅捷.QPI总线实现了多核处理器内部的直接互联,在多处理器作业下,每颗处理器可以相互传送资料,并不需要经过芯片组,从而大幅提升整体系统性能.

  (6)CUDA编程情况

  在GPU情况下,接纳CUDA(Compute Unified Device Architecture)通用并行盘算架构使GPU能够解决庞大的盘算问题.它包括了CUDA指令集架构(ISA)以及GPU内部的并行盘算引擎.开发人员现在可以使用C语言来为CUDA?架构编写程序,C语言是应用最广泛的一种高级编程语言.

  (7)微异构编程情况

  在MIC微异构情况下,接纳与Intel通用编程情况相同的编译情况,可以接纳Intel Cluster Studio工具包进行统一软件情况的装置、调试等事情.Intel Cluster Studio工具包括了C/C++/Fortran编译器、MKL数学库、MPI通讯库、Inspector线程检查工具、Vtune调优工具等.

客户收益

  可靠&宁静:

  深度学习模型训练及应用支持,是在大宗数据源在并行算法下进行多条理、连续性迭代盘算的应用 。并行盘算平台的稳定和宁静是整个深度学习盘算能否完成的必备包管,是人工智能能力的要害组成部分,是典范的要害性应用 。pg电子官网NF5568M4通过最全面的实际测试和大宗的行业应用,并经过严格的测试和验证,实时监控包管系统7*24小时不间断的运行 。NF5568M4在上一代互联网行业大客户占有率100%的NF5588M3基础上进行全方位优化升级,进一步提高单机并行盘算能力,降低了每盘算焦点TCO 。

  高效&经济

  GPU卡的密集水平从某种水平上影响着深度学习的效果,在一开始我们就为猿题库提供了业内GPU密集度最高的NF5568M4超算效劳器 。在相同CPU盘算能力下,该效劳器的GPU配置数量比业内平均水平横跨50%,并且最高支持的单卡盘算能力比业内主流水准横跨50% 。在每台机械均具有“一机多卡”的GPU集群搭建能力,在配置高性能网卡情况下,可支持业内最高标准的“多机多卡”深度学习集群的组建,后期扩展性能强大 。

  通过合理的盘算硬件选型,在线下模型训练时可以将训练时间提升5-6倍,而线上预测速度也获得2-4倍的提升,再经过语言模型的纠错,小猿搜题最终实现题目拍照之后“秒懂你的心”的效果 。


线

?



×
PG电子·(中国)官方网站 联系pg电子官网
ERP、企业软件购置热线
400-018-7700
云效劳产品销售热线
400-607-6657
集团客户投诉热线
400-691-8711
智能终端产品客服热线
400-658-6111
网站地图