首页 随笔 乐走天涯 程序资料 评论中心 Tag 论坛 其他资源 搜索 消息中心 联系我 关于 RSS

CPU专题--辉煌的今日(Cyrix,IDT,RISE)


日期: 2000-06-12 14:00 | 联系我 | 关注我: SteemIT, Twitter, Google+

  Cyrix

Cyrix 也算是一家老资格的CPU开发商了,早在X86时代,它和INTEL,AMD就形成了三雄并立的局面。自从INTEL另辟途径,开发了Pentium之后,CYRIX也很快推出了自己的新一代产品棗5X86。可能是CYRIX低估了独立研制一块CPU的难度吧,5X86可以说是一款失败的产品,没错,比起486来说性能是有所增加,可是比起Pentium来说,不但浮点性能远远不足,就连CYRIX一向自豪的整数运算性能也不那么高超,给人一种比上不足比下有余的感觉。有余5X86可以使用486的主板,因此我们一般将它看成是过渡产品。

后来CYRIX见势头不对,为了挽回面子,又匆匆推出了6X86系列的CPU,自从Cyrix与美国国家半导体公司合并后,使其终于拥有了自己的芯片生产线,其成品将会日益完善和完备。Cyrix的6x86是其投放到市场上的与Pentium兼容的处理器。它使用的是PR等级评定来进行CPU的标称。其PR-133CPU,运行在120MHZ,性能却同Pentium 133是相同的。但其发热量巨大。后期发布的是6x86LCPU,该CPU使用的是双电压设计,即核芯电压是3.3,I/O电压是5V。从而大大降低了CPU的温度,该档次的CPU,PR-200+使用的是75MHZ的外频在150MHZ的时候就提供了与Pentium 200相同的性能,可见CPU外频的重要性。到了MMX时代,Cyrix推出了他们的MX CPU,这一档次的CPU全是采用双电压设计,频率从166-233MHZ,到266-300时用MII来命名。Cyrix的MX CPU的整数性能是无与伦比的,但其MMX和FP性能和AMD一样,都比同档次的Pentium要差,MX的MMX和FP性能比K6还差,这些好像是Cyrix CPU的一贯特色。其MX的CPU发售的有60、66、75MHZ的几种,60MHZ的是测试版,66和75MHZ都是正式发行版,为什么有两种版本呢?因为当时Cyrix还没与美国国家半导体公司合并,其生产工艺还不过关,它就把上不了75MHZ的CPU标成同档次的66MHZ外频的来卖。

Cyrix作为非Intel阵营的另一个重要成员,1998年主要是在原有产品基础上进行改进,推出新的升级产品。1997年Cyrix曾推出了低价位和高集成度的Media GX,促进了1000美元以下PC机市场的兴起。Cyrix在1998年作的第一件事,就是把Media GX升级为具有MMX功能的版本。同时,Cyrix对它的拳头产品6X86MX作了进一步的改进,采用了新的名称MⅡ,并在1998年4月问世。MⅡ采用了更先进的技术,因此具有更快的内核速度和总线速度。

而为了继续向中、低端市场进攻,CYRIX又打算推出最新一代的CPU——Jalapeno。

Jalapeno的内部与6X86、6X86MX、MII等第六代芯片不相同,完全是一种新的架构。Cyrix发现了对机器性能有影响的内存反应周期瓶颈,于是使用芯片自带缓存/内存控制器与高速I/O接口,以及缩小芯片体积的方法,减少内存反应时间和增加数据传输带宽(3.2GB/秒),从而加快了CPU的运算。Cyrix的方法有以下几种:二级I缓冲预示,2个不确定的预测命中;二级D缓冲预示,4个不确定的预测命中;独立地从DRAM中取得二级I错误和D错误(25~50%的二级错误预示,强制性错误时减少预示延迟,256KB做到512KB的工作);自带内存控制器减少内核到DRAM的存取时间,使Socket7系统的存取时间达到20毫微秒(DRAM存取时间除外),而普通的Socket 7/Slot 1总线只有50毫微秒;内存控制器有32个开放页,比一般的芯片组还要多;使用RDRAM(Rambus Direct RAM,直接型RambusRAM)。高速处理器受限于纵深管道和二级缓存,Jalapeno的11条纵深管道可达到GHz级,8路互联交叉256KB二级缓存能工作在与芯片相同的速度下,所以Jalapeno能拥有较高的时钟频率。另外,图形子系统会使用二级缓存来作纹理缓冲区,在进行3D图形应用时,全速的256KB L2 Cache甚至可以比得上传统的512KB L2 Cache。

Jalapeno的新浮点单元是个双重FPU/MMX结构,它包括了两个完整的指令管道,独立的X87加法器和乘法器,因而两个FPU都支持MMX和3DNow!指令,而且它们不会相互干扰。新内核还集成了3D图形引擎,这是Cyrix第一次利用双重FPU来对图形子系统作优化,再加上CPU内部集成的3D图形控制器,使Jalapeno得到了极强的三维应用能力。因为M3使用了UMA(Unified Memory Architecture,统一内存架构),所以无须再购买图形帧缓存,而且GART(Graphic Address Remappng Table,图形地址重绘表)的速度也比帧缓冲快,可谓少花钱办大事。同时,它亦运用了NS(National Semiconductor,国家半导体)的Mediamatics多媒体辅助技术,增强了DVD的播放。

下面是Jalapeno的详细内部结构:

一,Jalapeno的X86内核技术参数:

1,双重X86注册重命名和乱序执行(2个整数单元、2个FP/MMX单元、1个分支单元和1个读取/存储单元)

2,11个纵深管道(使用0.18微米工艺,时钟频率可达600MHz,芯片面积为110~120平方毫米,由NS的南波特兰市实验室研制)

3,分支预测(1K入口,拥有7位历史记录和预测ROM的4路BTB,16K返回堆栈入口)

4,16KB,4路IC,2个不确定的预测命中

5,16KB,4路双端口DC,4个不确定的预测命中

6,256KB,8路二级缓存,8个不确定的预测命中

二,Jalapeno的指令解码步骤:

1,从BTB中取得下一条预测指令。

2,IC和缓冲区流出32字节的数据。

3,上行的2个完全X86指令进行检验和缓冲(先上行2个位于前面的字节,这个过程没有缓冲预先确定的数据位数)。

4,解码和流出要运算的数据(本过程仅用了1个内存操作周期)。

5,指令解码到内核中。

三,节点数据发送

1,每条指令将映射到1,2或更多的节点中(每个节点包含来源地址、目标地址和控制代码)。

2,数据将并列地上行到2EX、1AC、1BR和2 FPU节点中。

3,大多数指令都可以通过两个并行处理单元双重流出(这些指令包括padd reg,mem/pand reg,reg;faddreg,reg/fmul reg,reg; add mem,reg/shl reg,reg; cmp reg,mem/jcc)。

4,每个节点由检查、重命名、流出并执行等几个单元组成。

5,Jalapeno内共有16个检查点(96节点)。

四,分支处理

1,独立的分支单元(可获得更多的内核带宽)。

2,标记结果以产生乱序指令。

3,按顺序执行分支。

4,在分支执行和开始改正错误时把其它错误分离。

5,在12个时钟周期内改正错误。

6,分支执行后刷新BTB。

五,整数运算单元

1,完全管道架构。

2,大部分执行指令和结果都能在1个时钟周期内到达双处理单元。RCL/RCR/BSF/BSR需要2个时钟周期,整数乘法(MMX乘法)需要8~12个时钟周期,整数除-1的每位商结果需要1个时钟周期。

3,使用整数乘法和除法对整数进行并列执行操作。

4,快速地把整数变换成FPU/MMX结果。

六,FP/MMX单元

1,完全管道型X87加法器,4/1

2,完全管道型X87乘法器,5/1

3,FDIV 23(SP),33(DP,EP)

4,双重单元同时支持MMX和3DNow(MMX:1/1,转换:2/1,mul 4/1;3DNow:3/1,pfrcp/pfsqrt/pfmul:5/1)

七,读取/存储单元

1,单精度型读取/存储单元的特点有:16KB,4路,非模块型数据缓冲(3周期存取,1周期读入,1周期存储/载满数据);32入口,完全联合型一级DTLB;512入口,8路二级TLB(Translate Look side Buffers,翻译旁视缓冲器);12入口的数据存储序列。

2,按请求顺序传输数据。

3,数据可上行到4个一级不确定预测单元(预测错误的数据将变回无序状态)。

4,数据可按序补充到执行单元中

八,二级缓存

1,256KB,8路联合,8路交叉存取

2,每时钟周期交叉存取可支持:1个一级预测错误或1个一级存储或二级载满。

3,所有管道都运行于同内核一样的频率下

4,从一级缓存到二级缓存有7时钟周期的存取反应时间。

5,256位一级缓存重新载满(非后置式载入)

6,充许用真实代码或运行图形引擎时锁住二级缓存。

九,图形性能及特性

1,3百万个多边形/秒、266M像素/秒,时钟频率230MHz

2,支持Direct3D等工业标准API,雾化,Alpha混合,反混和(Anti-Aliasing),各向异性纹理过滤(Anisotropic Texture Filtering),集成MPEG2/DVD回放。

综上所述,Jalapeno系统性能的增强得益于它的新X86内核,256KB二级全速缓存,双浮点单元和一个3D图形引擎,这些都能大大加强新CPU的功能,因此Cyrix准备把新内核用于1999年低发布的处理器M3(速度可达600~800MHz),以此来迎击英特尔Katmai、AMD K6-3和IDT Winchip 4。Cyrix CPU一向都以价廉物美著称,而Jalapeno面对仍是主流PC,相信公司会继续走原来的低价格路线,用便宜货来占领市场。

  IDT

自Intel宣布不再进行基于Socket7的CPU开发后,这一领域的其他开发商和芯片组、主板生产厂商随即团结起来,推出了Super7体系结构,以最大限度地挖掘此体系架构的潜力。美国IDT公司(Integrated Device Technology)作为新加入此领域的CPU生产厂商,一上来就把着眼点放在了低端市场上。1997年IDT推出的第一个微处理器产品是WinChip(即C6),由于问世较晚且生产规模也不大,因此在整个CPU市场上所占的份额很小,还不足1% 。1998年5月,IDE宣布了它的第二代产品WinChip 2 。WinChip2有两种版本,一种带有3DNow!指令集,命名为WinChip 2-3D;另一种不带3DNow!指令集,其命名为WinChip 2,没有后缀3D。WinChip 2在原有WinChip的基础上作了一些改进,增加了一个双指令的MMX单元,增强了浮点运算功能。改进后的WinChip 2比相同频率的WinChip性能提高约10%,基本达到Intel处理器的性能。WinChip 2目前的最高频率CPU为WinChip 300MHz。

99年的第一季度里面,IDT发布了新处理器WinChip 2+NB,CPU内集成了主板北桥芯片,将会加快芯片到内存的存取速度。但此种做法有几个缺点:一是必须购买新主板;二是提高了芯片的面积,只够集成64K全速缓存到CPU中(性能与存取速度为3-1-1-1的256K二级缓存相当),毕竟,更大的一级缓存肯定比小量L1 cache+大量L2 cache要好。WinChip 2+NB使用0.25微米工艺制造,世片面积约58平方毫米。

至于即将发表的WinChip2的增强形芯片--WinChip3使用新的内核和超级流水线技术,将比WinChip2快两倍,最低频率266MHz,使用0.25微米工艺制造,世片面积约75平方毫米。

还在发展计划之中的WinChip4是真正的第二代Winchip处理器,使用0.25微米工艺制造,世片面积约95平方毫米(如果用0.18微米工艺制造,世片面积只有60平方毫米),它比153平方毫米的赛扬A(0.25微米工艺)要小得多。拥有128KB一级缓存,芯片频率为400~700MHz,芯片电压为16W(2.5V)或9W(1.8V)。以下是Winchip4的芯片和缓存规格:

1,11进程管道(目前的CPU只有6进程)

2,管道缓冲(读取时间为1个时钟周期)

3,相关的单控制逻辑和数据路径

4,使用动态逻辑芯片

5,6层金属制造

7,指令优化功能,适合高频率芯片而且不会浪费处理器的计算时间

6,2*64KB,2/4路一级缓存

7,2*128,8路一级TLB。

8,缓存可做智能预测、写入分配、合并和动态锁定等工作

IDT为WinChip4提供了发展工具包(PLA发生器,逻辑优化等),软件商们使用这些程序可以让自己的软件在新处理器上更好地工作。WinChip4使用新式的预测算法,增加分支预测时的成功率。99年底,IDT将把WinChip4推出市场。从技术上来看,WinChip4的竞争对手是英特尔赛扬A,AMD K6-3和Cyrix MII jedi,它们的产品各有特点,很可能会斗得难分难解。

  Rise

Rise公司是一家成立于1993年11月的美国公司,主要生产x86兼容的CPU,但在1998年以前很少有人知道它。一年前,该公司如此彻底地改变了它的运作方式,使人不能不注意到它。它开始在媒体上大做广告并发布了许多令人意想不到的内容。坦率地说,Rise公司的行动看起来象是把广告宣传而不是生产硬件当成主业了。在这其间,Rise公司宣称将为笔记本及1000美元以下市场开发基于Socket 7的x86兼容CPU-著名的mP6 CPU。根据Rise公司的说法,不管该CPU的价格怎样,它将与同主频的Intel Pentium II CPU一样快。这是通过使用超流水线的超标量结构技术来实现的,它可以让3条整数指令或3个MMX指令或者2个浮点操作同时进行。这是理论上超过Pentium II最好的方法,因为Pentium II只有两条整数流水线,一个单FPU单元和2个MMX单元。因此,我们认为只有还未面世的AMD公司的K7 CPU才是它唯一有威胁的对手。的确,这一切看起来是很有可能的,特别是当你看到Rise公司熟练的工程师队伍的时候。虽然他们没有生产能力,但他们有80名拥有在如AMD、HP、IBM、LSI、Logic、MIPS、NEC、Sun这样的处理器公司工作经验的工程师。

不过有实力是一回事,所推出的产品如何又是另外一回事了,现在的MP6已经可以在市场上看到,我们可以发现它的确是名不虚传:

mP6不仅价格便宜,而且性能优秀,有着很好的多媒体性能和强大的浮点运算,在98微处理器论坛上他们演示了mP6,它可以很出色地工作在WINDOWS下,并且mP6-266的DVD软解压为28帧/秒,这个数字就连PII300也很难达到,并且它还支持软件调制解调器,利用软件和一些必要的连线就可以上网,些时的CPU占用率只有10%,不仅如此,它还演示了其它多媒体能力和视频会议系统,总之mP6在每个方面都有优秀的表现。MP6每个时钟周期可以同时执行3条X86整数指令,目前只有Intel的Pentium II处理器在执行指令时才能做到。同时mP6每个时钟周期可以同时执行3条MMX指令,目前Pentium II处理器才只能2条。并且MP6通过一个管道浮点单元还能做到同时处理多个浮点运算,这样就大大提升了它的3D处理能力。很可惜mP6为了降低成本所以只有16KB的一级缓存,但还将推出的第二代MP6处理器会有16KB一级缓存和256KB二级缓存。mP6的目标就是笔记本电脑,所以它的耗能很低,其中mP6-233的最大功率是8.2W,要知道K6-2 233MHz是9W,K6-2 266是9.8W,PII 266更高,为19.5W。另外mP6使用了特殊的电路来作芯片的能源管理工作,无须用户干涉,十分适合用作笔记本电脑的CPU。mP6使用Socket 7/Super 7兼容插座,现在正在和ALI合作生产主板芯片组,它可以提供100MHz总线、AGPX2支持、DVD软解压、软件调制解调器、高级电源管理系统,看来RISE的加入,又替风云变换的CPU市场增加了一道风景线。

标签: CPU | Cyrix | IDT | RISE

 文章评论
目前没有任何评论.

↓ 快抢占第1楼,发表你的评论和意见 ↓

发表你的评论
如果你想针对此文发表评论, 请填写下列表单:
姓名: * 必填 (Twitter 用户可输入以 @ 开头的用户名, Steemit 用户可输入 @@ 开头的用户名)
E-mail: 可选 (不会被公开。如果我回复了你的评论,你将会收到邮件通知)
网站 / Blog: 可选
反垃圾广告: 为了防止广告机器人自动发贴, 请计算下列表达式的值:
9 x 5 + 2 = * 必填
评论内容:
* 必填
你可以使用下列标签修饰文字:
[b] 文字 [/b]: 加粗文字
[quote] 文字 [/quote]: 引用文字

 
首页 随笔 乐走天涯 猎户星 Google Earth 程序资料 程序生活 评论 Tag 论坛 资源 搜索 联系 关于 隐私声明 版权声明 订阅邮件

程序员小辉 建站于 1997 ◇ 做一名最好的开发者是我不变的理想。
Copyright © XiaoHui.com; 保留所有权利。