威尼斯官方网站世界首款7纳米

威尼斯官方网站 20

原标题:华为、苹果争“世界首款7纳米”,台积电:稳了!

                     关于麒麟970,你应该知道的

姓名:高浪

【嵌牛导读】:作为华为2017年度重磅旗舰机型,Mate10头号亮点就是它拥有AI人工智能特性,麒麟970集成了专用的神经网络处理单元NPU,比以往都要快的多体验速度,那么关于麒麟970,你应该知道什么呢?

【嵌牛鼻子】:华为,海思麒麟970,AI,神经网络,·

【嵌牛提问】:麒麟970芯片最新的亮点是什么?与骁龙、三星相比,其性能如何?

【嵌牛正文】:

麒麟970芯片是华为海思推出的一款采用了台积电10nm工艺的新一代芯片,是全球首款内置独立NPU(神经网络单元)的智能手机AI计算。

威尼斯官方网站 1

华为的新款芯片麒麟970,为推出的旗舰机型Mate
10和其他高端手机提供更快的处理速度和更低的功耗。2017年9月2日,在2017年德国柏林国际消费类电子产品展览会上,华为发布人工智能芯片麒麟970。首款采用麒麟970的华为手机Mate
10,在2017年10月16日在德国慕尼黑正式发布。

威尼斯官方网站 2

威尼斯官方网站 3

1.主要特点

专门的AI硬件处理单元。麒麟970芯片最大的特征,是设立了一个专门的AI硬件处理单元—NPU(Neural
Network Processing Unit,神经元网络),用来处理海量的AI数据。

倒计时6**天**

2.人工智能战略

麒麟970发布后,华为终端营销应该会把“AI”作为突出卖点,并且围绕AI开始构建生态。在人工智能时代,理想的状况是智能终端将变成人的助手,真正实现“知你”、“懂你”、“帮你”。这就要求人工智能技术不断演进,不仅是被动响应用户的需求,更能够主动感知用户状态和周边环境,并提供精准服务的全新交互方式。

威尼斯官方网站 4

新智元将于9月20日在北京国家会议中心举办AI WORLD
2018世界人工智能峰会,计算机视觉领域先驱、约翰霍普金斯大学认知与计算机科学系教授Alan
Yullie将亲临会场,发表主题演讲《深度网络及更多:大数据不是万能的》。
随着计算机视觉技术的发展,如何利用小数据乃至无数据解决特定应用场景问题,将是最新的一个关键点,欢迎到现场交流!

3.规格参数

以往的手机芯片普遍是以CPU(中央处理器)/GPU(图形处理器)/DSP(数字信号处理)为核心的传统计算架构,但这种架构难以支持AI海量数据计算。为此,麒麟970中单设了一个专门的AI硬件处理单元,为CPU、GPU等架构减负,目的都是为提高应用效率和降低能耗。这道理跟当初在CPU和GPU之外,增加DSP等架构设计的初衷一样,都是为了分担主系统的计算负担。

华为麒麟970首次集成NPU采用了Hai移动计算架构,其AI性能密度大幅优于CPU和GPU。相较于四个Cortex-A73(移动处理器龙头ARM去年推出的旗舰机CPU)核心,在处理同样的AI应用任务时,麒麟970新的异构计算架构拥有大约50倍能效和25倍性能优势。这意味着,麒麟970芯片可以用更高的能效比完成AI计算任务。例如在图像识别速度上,可达到约2000张/分钟。

麒麟970创新设计了HiAI移动计算架构,利用最高能效的异构计算架构来最大发挥CPU/GPU/ISP/DSP/NPU的性能,同时首次集成NPU专用硬件处理单元,其加速性能和能效比大幅优于CPU和GPU。

一个系统级的手机芯片主要包括CPU/GPU/DSP/ISP,以及基带芯片等诸多部件。这次麒麟970依然内置了八核CPU,与上一代麒麟960相比没有任何变化。在GPU上,麒麟970则用上了ARM在2017年5月刚刚发布的Mali-G72架构,性能较Mali-G71有所提升,此外,在核心数上,麒麟970的GPU也从麒麟960的8核增加到了12核。

在基带芯片上,华为发挥了自己作为通信设备厂商的优势。麒麟970直接大跨步支持LTE(4G)Cat.18(网速等级),最高下载速度可达了1.2Gbps。尽管在CPU和GPU没有特别大的惊喜,但由于麒麟970采用10纳米制程,也会提升整体性能。余承东表示,麒麟970的能耗比提升了20%。

制程上,麒麟970用上了台积电(TSMC)最新的10纳米工艺,这应该是继苹果A10X、联发科Helio
X30之后,第三款采用台积电10纳米制程的移动SoC。通常来说,在芯片晶体管数量相同的情况下,更先进的制程可以降低芯片的核心面积,有助于降低成本,并且更加有效地控制发热。

不过有趣的是,麒麟970的核心面积并没有因为制程的进步而缩小,反而比麒麟960还要略大,这是因为麒麟970集成了高达55亿个晶体管,比麒麟960多出了15亿。55亿个晶体管是什么概念呢?大家可以参考几个数字。Intel在2014年发布的拥有18个核心的至强E5
CPU,也才内置了55.6亿个晶体管。在更具对比价值的移动SoC中,以”对料”著称的苹果A10拥有33亿个晶体管,高通骁龙835拥有31亿个。需要说明的是,虽然晶体管数量对性能有一定的影响,并且通常是越多越好,但在芯片工艺、架构不同的情况下,我们是无法简单地用晶体管数量来判断性能的,尤其是在内部部件众多的移动SoC。

4.性能对比

信息显示,麒麟970单核跑分为1900分,多核跑分6209分,属于当前旗舰芯片水平。测试的华为Mate
10设备内置6GB运存,八核处理器主频为1.84GHz,并已搭载最新的Android
8.0系统。相比,骁龙835处理器单核跑分为1900分左右,多核跑分在6500分左右,三星Exons
8895单核跑分约为2100,多核跑分约为7100,这说明麒麟970的性能跟骁龙835和三星Exynos8895已基本处于同一水平。至于今年的苹果A11六核处理器,性能则异常残暴,单核约为4200,多核过万,远超对手。

来源:IEEE Specturm,DigitTimes 等

新智元编辑部

【新智元导读】“稳了”,余承东在苹果发布会后说;华为终端公司则“感谢”苹果,“给了我们做英雄的机会”。苹果A12和华为麒麟980,究竟谁才是“全球首款7纳米手机芯片”?如果非要点名指姓说一家,那就是生产这两款芯片的台积电。

“稳了”!

昨天,在苹果2018秋季新品发布会刚刚结束后的凌晨3点零1分,华为消费者BG
CEO余承东在微博上发文:“稳了,我们十月十六日伦敦见!”

威尼斯官方网站 5

10月16日,伦敦,正是华为下半年旗舰机
Mate20 系列的发布时间和地点。

随后,“华为终端公司”微信号发布海报,标语为——“谢谢你,给了我们做英雄的机会”。

威尼斯官方网站 6

这简直就像某老坛酸菜牛肉面的广告最后直接说别人抄袭一样,华为要表达的意思也再明显不过。

今年,苹果的新品外观虽无太大新意,价格反而让人“惊喜”:“廉价版”iPhone
XR起售价6499元,顶配版iPhone XS MAX则高达12799元。

缺乏新意却昂贵的苹果新品,可能让中国消费者有更多的兴趣关注国产手机。在这样一个日子里,华为这一波操作不仅引起舆论热议,热心网友还纷纷在线激情P图,为华为助威,顺带把华为送上了微博热搜。

威尼斯官方网站 7

威尼斯官方网站 8

苹果A12 vs 华为麒麟980:究竟谁才是全球首款7纳米AI芯片?

这次舆论关注的一个最大焦点,是苹果和华为双方都在各自发布会上公开宣称为“全球首款7纳米手机SoC”的苹果A12和华为麒麟980。

芯片决定了手机应用程序的种类和性能,先把谁是“全球首款”这个问题放在一边,新智元根据公开资料,整理了A12和麒麟980的性能规格对比:

威尼斯官方网站 9

A12仿生:iPhone 迄今最智能、 最强大的芯片

威尼斯官方网站 10

苹果的新款 A12 仿生芯片(A12
Bionic)由4 个 GPU 核心、6 个
CPU 核心以及 8 核心的 “神经网络引擎”
组成,用于处理机器学习任务。

威尼斯官方网站 11

根据苹果公司的说法,这种神经网络引擎每秒能执行 5 万亿次运算,是之前的八倍,消耗的能量只有之前版本的十分之一。

威尼斯官方网站 12

在开始拆解分析苹果A12仿生之前,我们应该提一下去年A11仿生的重要升级也很重要。该处理器采用全新的性能控制器,允许
A11
同时运行所有六个内核,以实现密集型工作负载。苹果在移动硬件领域真正改变了游戏规则,这一事实巩固了苹果在智能手机处理器顶端的领先优势。

回到A12仿生,在 CPU
核心中,有两个是为性能而设计的,比前一代 A11 仿生芯片快 15%。其他 4 个 CPU
核心都是为提高效率而设计
的,比
A11 仿生芯片节能最高达
50%。系统可以决定如何组合分配三种类型的核心,以最高效地运行任务。

A12仿生的GPU 为四核心,与 A11 仿生相比速度提升
50%
。对于这个四核心的GPU,除了知道它是定制设计的外,现在还没有任何公开架构细节。这个GPU最早出现在A8上,具有定制的着色器核心(shader
core)和编译器。苹果去年正式与Imagination
Technologies分道扬镳,但早在那之前苹果就开始着手自研定制设计。

最大的重头戏是8核心的神经网络引擎,这是苹果处理器升级的真正优势。A11的神经网络引擎只有两个核心,A12将其增加到8个——相应地,峰值性能增加到5
TFLOPS,即每秒执行 5
万亿次运算。这是8倍的提升,显示出密集SoC的强大优势。此外,A12的ISP(图像信号处理器)也加持了神经网络引擎,新iPhone系列的智能HDR效果有了大幅提升。

威尼斯官方网站 13

八核心的神经网络引擎

最后,半精度浮点数(16 位)也出现在 A12
上。 在 A8 之后,Apple 开始转向 16 位,A12
的神经引擎也是如此。这使得芯片可以快速执行操作并节省电力。

神经网络引擎能力的提升,也增强了新 iPhone
机器学习能力,包括发送信息、拍照、人像模式、AR
功能、甚至原彩显示,都可以调用神经网路引擎进行学习优化。包括 Siri 在 iOS
12
中也拥有更强的学习功能,可以深度学习用户的使用路径与习惯。值得一提的是,这些神经网络功能的运算调用,所消耗的电量仅为前代产品的十分之一。

威尼斯官方网站 14

AR
功能调用神经网络引擎

A12仿生的神经网络引擎也开放给 Core ML
平台,Core ML 运行速度比 A11 仿生提高 9
倍。开发者可将强大、实时的机器学习应用到自己的 app 中,让学习在 iPhone
上即可进行。

VLSI 研究分析师 G. Dan Hutcheson 称,A12
仿生芯片是 “一项令人印象深刻的壮举”,他说该芯片
“表明沿着摩尔定律这条路走下去,对各厂家来说仍然有吸引力”。

麒麟 980:创造了 6 个世界第一

华为的麒麟 980 芯片于 8 月 31 日在柏林
IFA 2018 上亮相。它将 69 亿个晶体管封装在一块 1
平方厘米的芯片上。

威尼斯官方网站 15

华为宣称,麒麟 980 创造了 6
个世界第一:

  • 全球最早商用的台积电 7nm 工艺的手机 SoC 芯片
  • 全球首次实现基于 ARM Cortex-A76 开发的商用 CPU 架构,最高主频可达
    2.6GHz
  • 全球首款搭载双核 NPU
  • 全球最新采用 Mali-G76 GPU
  • 全球最先支持 LTE Cat.21,峰值下载速率 1.4Gbps,达到业内最高
  • 支持全球最快 LPDDR4X 颗粒,主频最高可达 2133MHz,同样业内最高

具体来说,麒麟 980 是第一款使用基于 Arm
Cortex-A76 处理器的芯片,与其前身 A73 和 A75 相比,性能提高了
75%,效率提高了 58%。

威尼斯官方网站 16

它有 8 个内核,2 个是基于 A76
的大型高性能内核,2 个同样是 A76 的中等性能内核,以及 4 个基于
Cortex-A55 设计的小型高效内核。这个系统运行在 ARM big.LITTLE
架构的一个变体上,其中大型处理器处理即时、密集的工作负载,小型处理器负责持续的后台任务。

麒麟 980 的 GPU 组件称为
Mali-G76,与上一代相比,它的性能提升了 46%,效率提升了 178% 的。麒麟 980
芯片还有一个双核神经处理单元。用业界最常用的图像识别速率做标准,使用双核
NPU 的麒麟 980 每分钟识别图片的数量达到 4500 张,比 970
增加了一倍多。

华为还设计了一个名叫 “Flex-Scheduling”
的智能调度机制,能根据手机运行的应用智能地进行三级的调度,比如播放音乐就只需要一个小核,使用社交软件就动用中核,当有很多大量的负载,比如玩大型游戏时,就会使用大核。

威尼斯官方网站 17

苹果华为相争,台积电成最大赢家

很难说苹果A12仿生和麒麟980谁是真正的“王者”。光看数据,苹果强调每秒计算次数,华为强调图像识别速度,谁更厉害可能要等
10 月 16 日搭载麒麟 980 的华为 Mate 20
系列正式发布,拿真机测评才知道。

不过,A12处理器最傲人的是神经网络引擎的强化,一下子比上代提升9倍,有网友认为相比980的NPU可能是碾压级的。

苹果A12也好,华为麒麟980也罢,如果非要指名点姓说一家,谁才是真正的“全球首款7纳米芯片”,那答案则是生产这两种芯片的台积电

威尼斯官方网站 18

台积电7纳米芯片制作工厂。来源:Apple

事实上,现在的市场形势对台积电非常有利。

全球第二大晶圆代工厂格芯 (Global
Foundries) 上月底宣布,将无限期搁置7纳米投资计划。

格芯执行长 Tom
Caulfield表示,执行此计划的背后原因是:无法承受与三星和台积电的竞争压力。该公司希望避免将其大部分研究和设备预算,投入到可能永远无法获得回报的工作中。

格芯的重要客户是AMD,主要代工AMD的Ryzen、Radeon芯片。而此项宣布将使AMD将转向台积电。

这对台积电来说也是一份意外之喜,据报道,AMD的相关订单价值高达15亿美元,但目前台积电是唯一量产7nm代工厂,未来两三年还有可能增加到50亿美元。

尽管其他有可能角逐霸主之位的三星和英特尔也曾表示预定在2018年提供代工业者7纳米节点的对应技术,但台积电在这一方面仍处于领先位置。

威尼斯官方网站 19

为了摩尔定律“续命”,台积电也拼了老命

至于台积电本身,为了给摩尔定律“续命”,这家半导体巨头也可谓是拼了老命。

在大多数人感叹摩尔定律已经走向完结的当口,除了早早投入7纳米工艺研发,并于2017年第二季度进入试产阶段。

台积电使用DUV光刻的第一代7nm
FinFET与此前10nm FinFET制程相比,7nm
FinFET将可在晶体管数量不变的情况下使芯片尺寸减少37%,或在电路复杂度相同的情况下降低40%的功耗。

威尼斯官方网站 20

为了满足联发科、海思和高通等无晶圆厂客户不断增长的需求,台积电还提前在2018年第二季度将7纳米工艺技术推向大规模生产。

据台湾当地媒体DIGITIMES今年6月报道,有消息人士称,台积电已经收到越来越多的7纳米订单,还有更多的无晶圆厂客户打算跳过10nm工艺,转而直接使用7nm。

2016年,台积电就对外宣称,预计投入250亿美元,建设制造5纳米工艺芯片的工厂,并计划于2020年上半年推出5纳米工艺的芯片。

不仅如此,台积电还表示,计划在2022年之前筹建并运营全球首个3nm半导体晶圆厂,虽然有关其对环境潜在影响的公众听证会还在进行中,并且有可能减缓其计划。

但无论如何,3纳米已经逼近芯片上能容纳晶体管数量的极限,再往下缩就不得不考虑电子的量子效应。IBM高管在日前在一次公开发表会议上说,3年内量计算机就将成为现实。

在摩尔定律这条路上,在代工厂这个商业模式上,台积电非常成功,现在以及未来几年也将很辉煌,但良品率和研发投入高昂的5纳米、3纳米工艺,性价比是否真的值得?

最终,由此带来的性能提升,以及费用增长,都将落到消费者身上。

更多阅读:

倒计时 6

返回搜狐,查看更多

责任编辑:

发表评论

电子邮件地址不会被公开。 必填项已用*标注