admin 管理员组文章数量: 887021
2023年12月21日发(作者:边框软件)
计算机组成原理(第四版)课后习题参考答案
计算机组成原理(第四版)课后习题参考答案
白中英 戴志涛 李贞 等
第一章..............................................................................................................................................2
第二章..............................................................................................................................................4
第三章............................................................................................................................................15
第四章............................................................................................................................................20
第五章............................................................................................................................................22
第六章............................................................................................................................................28
第七章............................................................................................................................................32
第八章............................................................................................................................................35
第九章............................................................................................................................................37
第十章............................................................................................................................................39
1
计算机组成原理(第四版)课后习题参考答案
第一章
1. 模拟计算机的特点是数值由连续量来表示,运算过程也是连续的。数字计算机的主要特点是按位运算,并且不连续地跳动计算。模拟计算机用电压表示数据,采用电压组合和测量值的计算方式,盘上连线的控制方式,而数字计算机用数字0和1表示数据,采用数字计数的计算方式,程序控制的控制方式。数字计算机与模拟计算机相比,精度高,数据存储量大,逻辑判断能力强。
2. 数字计算机可分为专用计算机和通用计算机,是根据计算机的效率、速度、价格、运行的经济性和适应性来划分的。
3. 科学计算、自动控制、测量和测试、信息处理、教育和卫生、家用电器、人工智能。
4. 主要设计思想是:采用存储程序的方式,编制好的程序和数据存放在同一存储器中,计算机可以在无人干预的情况下自动完成逐条取出指令和执行指令的任务;在机器内部,指令和数据均以二进制码表示,指令在存储器中按执行顺序存放。主要组成部分有::运算器、逻辑器、存储器、输入设备和输出设备。
5. 存储器所有存储单元的总数称为存储器的存储容量。每个存储单元都有编号,称为单元地址。如果某字代表要处理的数据,称为数据字。如果某字为一条指令,称为指令字。
6. 计算机硬件可直接执行的每一个基本的算术运算或逻辑运算操作称为一条指令,而解算某一问题的一串指令序列,称为程序。
7. 取指周期中从内存读出的信息流是指令流,而在执行器周期中从内存读出的信息流是数据流。
8. 半导体存储器称为内存,存储容量更大的磁盘存储器和光盘存储器称为外存,内存和外存共同用来保存二进制数据。运算器和控制器合在一起称为中央处理器,简称CPU,它用来控制计算机及进行算术逻辑运算。适配器是外围设备与主机联系的桥梁,它的作用相当于一个转换器,使主机和外围设备并行协调地工作。
9. 计算机的系统软件包括系统程序和应用程序。系统程序用来简化程序设计,简化使用方法,提高计算机的使用效率,发挥和扩大计算机的功能用用途;应用程序是用户利用计算机来解决某些问题而编制的程序。
10. 在早期的计算机中,人们是直接用机器语言来编写程序的,这种程序称为手编程序或目的程序;后来,为了编写程序方便和提高使用效率,人们使用汇编语言来编写程序,称为汇编程序;为了进一步实现程序自动化和便于程序交流,使不熟悉具体计算机的人也能很方便地使用计算机,人们又创造了算法语言,用算法语言编写的程序称为源程序,源程序通过编译系统产生编译程序,也可通过解释系统进行解释执行;随着计算机技术的日益发展,人们又创造出操作系统;随着计算机在信息处理、情报检索及各种管理系统中应用的发展,要求大量处理某些数据,建立和检索大量的表格,于是产生了数据库管理系统。
11. 第一级是微程序设计级,这是一个实在的硬件级,它由机器硬件直接执行微指令;第二级是一般机器级,也称为机器语言级,它由程序解释机器指令系统;第三级是操作系统级,它由操作系统实现;第四级是汇编语言级,它给程序人员提供一种符号形式语言,以减少程序编写的复杂性;第五级是高级语言级,它是面向用户的,为方便用户编写应用程序而设置的。用一系列的级来组成计算机的接口对于掌握计算机是如何组成的提供了一种好的结构和体制,而且用这种分级的观点来设计计算机对保证产生一个良好的系统结构也是很有帮助的。
2
计算机组成原理(第四版)课后习题参考答案
12. 因为任何操作可以由软件来实现,也可以由硬件来实现;任何指令的执行可以由硬件完成,也可以由软件来完成。实现这种转化的媒介是软件与硬件的逻辑等价性。
13. 计算机应用和应用计算机在概念上是不等价的。
计算机应用是计算机学科与其他学科相结合的交叉学科,是计算机学科的组成部分,分为数值计算和非数值应用两大领域。
应用计算机是借助计算机为实现特定的信息系统功能的手段。在计算机系统的层次结构中,应用计算机是多级计算机系统层次结构的最终目标,是高级语言级之上的服务层次。
3
计算机组成原理(第四版)课后习题参考答案
第二章
1.(1)35(-100011)2
[35]原10100011
[35]补11011100
[35]反11011101
(2)
[127]原=01111111
[127]反=01111111
[127]补=01111111
(3)127(-1111111)2
[127]原11111111
[127]补10000001
[127]反10000000
(4)1(-00000001)2
[1]原10000001
[1]补11111111
[1]反11111110
2.[x]补 =
a0. a1a2…a6
解法一、
(1) 若a0 = 0, 则x > 0, 也满足x > -0.5
此时a1→a6可任意
(2) 若a0 = 1, 则x <= 0, 要满足x > -0.5, 需a1 = 1
即a0 = 1, a1 = 1, a2→a6有一个不为0
解法二、
-0.5 = -0.1(2) = -0.100000 = 1, 100000
(1) 若x >= 0, 则a0 = 0, a1→a6任意即可
4
计算机组成原理(第四版)课后习题参考答案
[x]补 = x = a0. a1a2…a6
(2)
若x < 0, 则x > -0.5
只需-x < 0.5, -x > 0
[x]补 = -x, [0.5]补 = 01000000
即[-x]补 < 01000000
a0*a1*a2a6101000000
a0*a1*a2a600111111
a0a1a2a611000000
)
即a0a1 = 11, a2→a6不全为0或至少有一个为1(但不是“其余取0”
3.字长32位浮点数,阶码8位,用移码表示,尾数23位,用补码表示,基为2
Es Ms M21 M0
E1→E8
(1) 最大的数的二进制表示
E = 11111111
Ms = 0, M = 11…1(全1)
11111111
1
(2) 最小的二进制数
E = 11111111
Ms = 1, M = 00…0(全0)
1 11111111 1000000000
(3) 规格化范围
= 11…1, Ms = 0
正最大 E = 11…1, M
8个 22个
即:2271(1222)
正最小 E = 00…0, M = 100…0, Ms = 0
8个 21个
即:222
71 负最大 E = 00…0, M = 011…1, Ms = 1
8个 21个
122(最接近0的负数)即:22(22)
7= 00…0, Ms =1
负最小
E = 11…1, M
8个 22个
即:2271(1)
规格化所表示的范围用集合表示为:
[222 ,
221771(1222)][221(1),22(21222)]
77
5
计算机组成原理(第四版)课后习题参考答案
4.在IEEE754标准中,一个规格化的32位浮点数x的真值表示为:
sE127(1)×(1.M)×2
X =
(1)27/64=0.011011=1.1011×2
E= -2+127 = 125= 0111 1101 S= 0 M= 1011 0000 0000 0000 0000 000
最后表示为:0 01111101 1
(2)-27/64=-0.011011=1.1011×2
E= -2+127 = 125= 0111 1101 S= 1 M= 1011 0000 0000 0000 0000 000
最后表示为:1 01111101 1
5.(1)用变形补码进行计算:
[x]补=00 11011 [y]补=00 00011
[x]补 = 00 11011
[y]补 = + 00 00011
[x+y]补= 00 11110
结果没有溢出,x+y=11110
(2) [x]补=00 11011 [y]补=11 01011
[x]补 = 00 11011
11 01011
[y]补 = +
[x+y]补= 00 00110
结果没有溢出,x+y=00110
(3)[x]补=11 01010 [y]补=11 111111
[x]补 = 00 01010
[y]补 = + 00 11111
[x+y]补= 11 01001
结果没有溢出,x+y=-10111
226.[x-y]补=[x]补+[-y]补
(1)[x]补=00 11011 [-y]补=00 11111
[x]补 = 00 11011
[-y]补 = + 00 11111
[x-y]补= 01 11010
结果有正溢出,x-y=11010
(2)[x]补=00 10111 [-y]补=11 00101
[x]补 = 00 10111
[-y]补 = + 11 00101
[x-y]补= 11 11100
结果没有溢出,x-y=-00100
6
计算机组成原理(第四版)课后习题参考答案
(3)[x]补=00 11011 [-y]补=00 10011
[x]补 = 00 11011
[-y]补 = + 00 10011
[x-y]补= 01 01110
结果有正溢出,x-y=10010
7.(1) 用原码阵列乘法器:
[x]原=0 11011 [y]原=1 11111
因符号位单独考虑,|x|=11011 |y|=11111
1 1 0 1 1
×) 1 1 1 1 1
——————————————————————————
1 1 0 1 1
1 1 0 1 1
1 1 0 1 1
1 1 0 1 1
1 1 0 1 1
1 1 0 1 0 0 0 1 0 1
[x×y]原=1 1101000101
用补码阵列乘法器:
[x]补=0 11011 [y]补=1 00001
乘积符号位为:1
|x|=11011 |y|=11111
1 1 0 1 1
×) 1 1 1 1 1
——————————————————————————
1 1 0 1 1
1 1 0 1 1
1 1 0 1 1
1 1 0 1 1
7
计算机组成原理(第四版)课后习题参考答案
1 1 0 1 1
1 1 0 1 0 0 0 1 0 1
[x×y]补=1
(2) 用原码阵列乘法器:
[x]原=1 11111 [y]原=1 11011
因符号位单独考虑,|x|=11111 |y|=11011
1 1 1 1 1
×) 1 1 0 1 1
——————————————————————————
1 1 1 1 1
1 1 1 1 1
0 0 0 0 0
1 1 1 1 1
1 1 1 1 1
1 1 0 1 0 0 0 1 0 1
[x×y]原=0 1101000101
用补码阵列乘法器:
[x]补=1 00001 [y]补=1 00101
乘积符号位为:1
|x|=11111 |y|=11011
1 1 1 1 1
×) 1 1 0 1 1
——————————————————————————
1 1 1 1 1
1 1 1 1 1
0 0 0 0 0
1 1 1 1 1
8
计算机组成原理(第四版)课后习题参考答案
1 1 1 1 1
1 1 0 1 0 0 0 1 0 1
[x×y]补=0 1101000101
8.(1) [x]原=[x]补=0 11000 [-∣y∣]补=1 00001
被除数X 0 11000
+[-|y|]补 1 00001
----------------------------------------------------
余数为负 1 11001 →q0=0
左移 1 10010
+[|y|]补 0 11111
----------------------------------------------------
余数为正 0 10001 →q1=1
左移 1 00010
+[-|y|]补 1 00001
----------------------------------------------------
余数为正 0 00011 →q2=1
左移 0 00110
+[-|y|]补 1 00001
----------------------------------------------------
余数为负 1 00111 →q3=0
左移 0 01110
+[|y|]补 0 11111
----------------------------------------------------
余数为负 1 01101 →q4=0
左移 0 11010
+[|y|]补 0 11111
----------------------------------------------------
余数为负 1 11001 →q5=0
+[|y|]补 0 11111
----------------------------------------------------
余数 0 11000
故 [x÷y]原=1.11000 即 x÷y= -0.11000
余数为 0 11000
(2) [∣x∣]补=0 01011 [-∣y∣]补=1 00111
被除数 X 0 01011
+[-|y|]补 1 00111
----------------------------------------------------
余数为负 1 10010 →q0=0
9
计算机组成原理(第四版)课后习题参考答案
左移 1 00100
+[|y|]补 0 11001
----------------------------------------------------
余数为负 1 11101 →q1=0
左移 1 11010
+[|y|]补 0 11001
----------------------------------------------------
余数为正 0 10011 →q2=1
左移 1 00110
+[-|y|]补 1 00111
----------------------------------------------------
余数为正 0 01101 →q3=1
左移 0 11010
+[-|y|]补 1 00111
----------------------------------------------------
余数为正 0 00001 →q4=1
左移 0 00010
+[-|y|]补 1 00111
----------------------------------------------------
余数为负 1 01001 →q5=0
+[|y|]补 0 11001
----------------------------------------------------
余数 0 00010
x÷y= -0.01110
余数为 0 00010
9.(1) x = 2-011*0.100101, y = 2-010*(-0.011110)
[x]浮 = 11101,0.100101
[y]浮 = 11110,-0.011110
Ex-Ey = 11101+00010=11111
[x]浮 = 11110,0.010010(1)
x+y 0 0. 0 1 0 0 1 0 (1)
+ 1 1. 1 0 0 0 1 0
1 1. 1 1 0 1 0 0 (1)
规格化处理: 1.010010 阶码 11100
x+y= 1.010010*2-4 = 2-4*-0.101110
x
-y 0 0. 0 1 0 0 1 0 (1)
+ 0 0. 0 1 1 1 1 0
0 0 1 1 0 0 0 0 (1)
规格化处理: 0.110000 阶码 11110
x-y=2-2*0.110001
(2) x = 2-101*(-0.010110), y = 2-100*0.010110
[x]浮= 11011,-0.010110
[y]浮= 11100,0.010110
10
计算机组成原理(第四版)课后习题参考答案
Ex-Ey = 11011+00100 = 11111
[x]浮= 11100,1.110101(0)
x+y 1 1. 1 1 0 1 0 1
+ 0 0. 0 1 0 1 1 0
0 0. 0 0 1 0 1 1
规格化处理: 0.101100 阶码 11010
x+y= 0.101100*2-6
x-y 1 1.1 1 0 1 0 1
+ 1 1.1 0 1 0 1 0
1 1.0 1 1 1 1 1
规格化处理: 1.011111 阶码 11100
x-y=-0.100001*2-4
10.(1) Ex = 0011, Mx = 0.110100
Ey = 0100, My = 0.100100
Ez = Ex+Ey = 0111
Mx*My 0. 1 1 0 1
* 0.1 0 0 1
0 1 1 0 1
0 0 0 0 0
0 0 0 0 0
0 1 1 0 1
0 0 0 0 0
0
0 1 1 1 0 1 0 1
规格化: 26*0.111011
(2) Ex = 1110, Mx = 0.011010
Ey = 0011, My = 0.111100
Ez = Ex-Ey = 1110+1101 = 1011
[Mx]补 = 00.011010
[My]补 = 00.111100, [-My]补 = 11.000100
11
计算机组成原理(第四版)课后习题参考答案
0 0 0 1 1 0 1 0
+[-My] 1 1 0 0 0 1 0 0
1 1 0 1 1 1 1 0 0
1 0 1 1 1 1 0 0
+[My] 0 0 1 1 1 1 0 0
1 1 1 1 1 0 0 0 0.0
1 1 1 1 0 0 0 0
+[My] 0 0 1 1 1 1 0 0
0 0 1 0 1 1 0 0 0.01
0 1 0 1 1 0 0 0
+[-My] 1 1 0 0 0 1 0 0
0 0 0 1 1 1 0 0 0.011
0 0 1 1 1 0 0 0
+[-My] 1 1 0 0 0 1 0 0
1 1 1 1 1 1 0 0 0.0110
1
1 1 1 1 0 0 0
+[My] 0 0 1 1 1 1 0 0
0 0 1 1 0 1 0 0 0.01101
0 1 1 0 1 0 0 0
+[-My] 1 1 0 00 1 0 0
0 0 1 0 1 10 0 0.01101
0.110110*2-6, 余数=0.101100*2-6
商 =
11.
4位加法器如上图,
CiAiBiAiCi1BiCi1AiBi(AiBi)Ci1AiBi(AiBi)Ci1
(1)串行进位方式
C1 = G1+P1C0 其中:G1 = A1B1 P1 = A1⊕B1(A1+B1也对)
C2 = G2+P2C1 G2 = A2B2 P2 = A2⊕B2
C3 = G3+P3C2 G3 = A3B3 P3 = A3⊕B3
C4 = G4+P4C3 G4 = A4B4 P4 = A4⊕B4
(2)并行进位方式
C1 = G1+P1C0
C2 = G2+P2G1+P2P1C0
C3 = G3+P3G2+P3P2G1+P3P2P1C0
C4 = G4+P4G3+P4P3G2+P4P3P2G1+P4P3P2P1C0
12
计算机组成原理(第四版)课后习题参考答案
12.(1)组成最低四位的74181进位输出为:
C4 = Cn+4 = G+PCn = G+PC0, C0为向第0位进位
其中,G = y3+y2x3+y1x2x3+y0x1x2x3,P = x0x1x2x3,所以
C5 = y4+x4C4
C6 = y5+x5C5 = y5+x5y4+x5x4C4
(2)设标准门延迟时间为T,“与或非”门延迟时间为1.5T,则进位信号C0,由最低位传送至C6需经一个反相器、两级“与或非”门,故产生C0的最长延迟时间为
T+2*1.5T = 4T
(3)最长求和时间应从施加操作数到ALU算起:第一片74181有3级“与或非”门(产,第二、三片74181共2级反相器和2级“与或非”门(进生控制参数x0, y0, Cn+4)位链),第四片74181求和逻辑(1级与或非门和1级半加器,设其延迟时间为3T),故总的加法时间为:
t0 = 3*1.5T+2T+2*1.5T+1.5T+3T = 14T
13.设余三码编码的两个运算数为Xi和Yi,第一次用二进制加法求和运算的和数为Si’,进位为Ci+1’,校正后所得的余三码和数为Si,进位为Ci+1,则有:
Xi = Xi3Xi2Xi1Xi0
Yi = Yi3Yi2Yi1Yi0
Si’ = Si3’Si2’Si1’Si0’
si3Ci+1si2FAsi1FA+3Vsi0十进校正FAFAsi3'FAXi3 Yi3FAsi2'FAsi1'FAsi0'二进加法Xi2 Yi2Xi1 Yi1Xi0 Yi0
当Ci+1’ = 1时,Si = Si’+0011
并产生Ci+1
当Ci+1’ = 0时,Si = Si’+1101
根据以上分析,可画出余三码编码的十进制加法器单元电路如图所示。
14.
Si=AiBiCi+ AiBiCi+ AiBiCi+ AiBiCi
图如下:
13
计算机组成原理(第四版)课后习题参考答案
Si
≥1&Ai
Bi
Ci
15.设计思想:电路由三部分构成:ALU完成定点加减法运算和逻辑运算,专用的阵列乘法器完成乘法运算,专用的阵列除法器完成除法操作。逻辑图可参考主教材图2.7和图2.9。
16.设计思想:因为有八种运算,所以控制信号采用三位,S0,S1,S2。加法和减法操作利用4位补码加减法器完成;加1操作可以单独设计电路实现,也可以将被加数强制为+1利用加减法器实现;传送操作可以利用加减法器实现,第二加数强制为0;逻辑乘和取反操作可设计单独的逻辑运算电路,用与门和反相器实现;取补电路单独设计,参见主教材图2.6;乘法操作可单独设计高速乘法器,电路参见主教材图2.7。
17. 设计思想:将74181的S3~S0及M等五个控制信号缩减为S2~S0三根信号,主教材表2.5(功能表中的算术运算和逻辑运算相应进行简化,去除冗余操作和可替代操作:
000: 逻辑0
001: AB
010: A+B
011: A⊕B
100: A加B
101: A减B减1
110: A加A
111: A
其中,000~011为四种逻辑运算,100~111为四种算术运算。根据功能表可以很容易地设计出简化的函数发生器。
14
计算机组成原理(第四版)课后习题参考答案
第三章
1. (1)2324M字节
81024K*32 (2)2*48片
512K*820* (3)1位地址作芯片选择
2. (1)
2/2=4(块)
(224/222)×(64位/8位)=32(片)
(2)
(3)主存共需DRAM芯片为:4×32=128 (片)
每个内存条有32片DRAM芯片,容量为16M×64位,需24根地址线(A23~A0)完成内
存条内存储单元寻址。一共有4块内存条,采用2根高位地址线(A25~A24),通过2:4译码器译码产生片选信号对各模块板进行选择。
3. (1)根据题意,存储总容量为64KB,故地址总线需16位。现使用16K*8位DRAM芯片,共需16片。芯片本身地址线占14位,所以采用位并联与地址串联相结合的方法来组成整个存储器,其组成逻辑图如图所示,其中使用一片2:4译码器。
(2)根据已知条件,CPU在1us内至少访存一次,而整个存储器的平均读/写周期为0.5us,如果采用集中刷新,有64us的死时间,肯定不行
如果采用分散刷新,则每1us只能访存一次,也不行所以采用异步式刷新方式。
假定16K*1位的DRAM芯片用128*128矩阵存储元构成,刷新时只对128行进行异步方式刷新,则刷新间隔为2ms/128 = 15.6us,可取刷新信号周期15us。
刷新一遍所用时间=15us×128=1.92ms
CS1CS0A13~A0
CS3 CS2
D0~D
2:4译码器
A14 A15
4. (1)26241024K*3232片
128K*8 (2)
15
计算机组成原理(第四版)课后习题参考答案
A0-A16CPUD0-D31Y1
A17-A19Y2Y3Y4Y5Y6Y7Y8
3:8译码器 (3)如果选择一个行地址进行刷新,刷新地址为A0-A8,因此这一行上的2048个存储元同时进行刷新,即在8ms内进行512个周期。刷新方式可采用:在8ms中进行512次刷新操作的集中刷新方式,或按8ms/512 = 15.5us刷新一次的异步刷新方式。
5. 所设计的存储器单元数为1M,字长为32,故地址长度为20位(A19~A0),所用芯片存储单元数为256K,字长为16位,故占用的地址长度为18位(A17~A0)。由此可用位并联方式与地址串联方式相结合的方法组成组成整个存储器,共8片RAM芯片,并使用一片2:4译码器。其存储器结构如图所示。
A19A18Y0Y1Y2Y3CS0~CS3D31-D16(高16位)CS0256k*16CS1W/RCS2CS3CPU256k*16A17-A16W/RCS0CS1CS2CS3D15-D0(低16位)W/R
6.(1)系统16位数据,所以数据寄存器16位
(2)系统地址128K=217,所以地址寄存器17位
(3) 共需要8片
(4) 组成框图如下
16
计算机组成原理(第四版)课后习题参考答案
CPU32K 32K
*8 *8
地址
寄存器
32K 32K
*8 *8
CS3CS2CS1数据
寄存器
A16
CS0
2:4
~
译码器
CS3
A15
7.(1)组内地址用A12~A0
(2)小组译码器使用3:8译码器
(3)RAM1~RAM5各用两片8K*8的芯片位并联连接
0000H
ROM
4000H
6000H
RAM1
8000H
RAM2
A000H
RAM3
C000H
RAM4
E000H
RAM5
32K
*8
32K
*8
32K
*8
CS0
32K
*8
17
计算机组成原理(第四版)课后习题参考答案
A0-A12ROMRAM8K*8RAM8K*8RAM8K*8RAM8K*8RAM8K*8D0-D15CPURAM8K*8RAM8K*8RAM8K*8RAM8K*8RAM8K*83:8译码器A13-A15
8.顺序存储器和交叉存储器连续读出m = 8个字的信息总量都是:
q = 64位*8 = 512位
顺序存储器和交叉存储器连续读出8个字所需的时间分别是:
t1 = mT = 8*100ns = 8*10-7s
t2T(m1)100ns7*50ns450ns4.5*107ns
顺序存储器和交叉存储器的带宽分别是:
W1q/t1512(8*107)64107[位/s]
W2q/t2512(4.5*107)113.8107[位/s]
的命中率
HNc24200.968
NcNm242080rTm2406
40Tc cache/主存系统效率e为
e11*100%*100%86.2%
r(1r)H6(16)*0.968 平均访问时间Ta为
TaTc40ns46.4ns
e0.862ns10. h*tc+(1-h)*tm = ta
htatm5020093.75%
tctm40200
18
计算机组成原理(第四版)课后习题参考答案
11.设取指周期为T,总线传送周期为τ,指令执行时间为t0
(1)t = (T+5τ+6t0)*80 = 80T+400τ+480 t0
(2) t = (T+7τ+8t0)*60 = 60T+420τ+480 t0
故不相等。
12.D
19
计算机组成原理(第四版)课后习题参考答案
第四章
1.不合理。指令最好半字长或单字长,设16位比较合适。
2.70条指令,所以操作码至少为7位。
双操作数指令格式可以为:
7 12 12
单操作数指令格式可以为:
7 25
无操作数指令格式可以为:
7
-
3.(1)RR型指令
(2)寄存器寻址
(3)单字长二地址指令
(4)操作码字段OP可以指定26=64种操作
4.(1)双字长二地址指令,用于访问存储器。操作码字段可指定64种操作。
(2)RS型指令,一个操作数在通用寄存器(共16个),另一个操作数在主存中。
(3)有效地址可通过变址寻址求得,即有效地址等于变址寄存器(共16个)内容加上位移量。
5.(1)双操作数指令
(2)23=8种寻址方式
(3)24=16种操作
6.(1)直接寻址方式
(2)相对寻址方式
(3)变址寻址方式
(4)基址寻址方式
(5)间接寻址方式
(6)基址间接寻址方式
7.40条指令至少需要操作码字段6位,所以剩下的长度为26位。主存的容量为64M字,则设寻址模式(X)2位,格式如下:
31 26 25 24 23 0
OP X D
X= 0 0
直接寻址 有效地址 E=D
X= 0 1 立即寻址 D字段为立即数
X= 1 0 变址寻址 有效地址 E= (RX)+D (可寻址64M个存储单元)
X= 1 1 相对寻址 有效地址 E=(PC)+D (可寻址64M个存储单元)
其中RX为变址寄存器(32位),PC为程序计数器(32位)。在相对寻址时,位移量D
20
计算机组成原理(第四版)课后习题参考答案
可正可负。
8.(1)50种操作码占6位,4种寻址方式占2位。以单地址指令为例:
OP(6)X(2)D(24)X = 00
寄存器寻址方式。D字段实际使用4比特选择16个通用寄存器。
D字段实际使用4比特选择16个通用寄存器。E= (RX)。
X = 01
寄存器间接寻址方式。X = 10 立即寻址方式。D字段给出24位立即数。
X = 11 直接寻址方式。D字段给出24位内存地址。E = D。
(2) 寻址模式字段变成3位,可以支持更多的寻址方式。可增加相对寻址方式,其有效地址E = PC+D;还可使用内存间接寻址,此时有效地址E = (D)。
9. 16个通用寄存器占4位,64种操作占6位,剩下22位用于存储器地址,
OP(6)R(4)D(22)
采用R为基址寄存器寻址,地址=(R)+D
当基址最大,D也是最大的时候,寻址能力最大
而寄存器是32位的,
故最大存储空间是232+222 = 4GB+4MB。
10. 表4.9的指令数为29,则指令的操作码至少为5位。设这些指令支持立即寻址、寄存器寻址、直接寻址、堆栈寻址、相对寻址、内存间接寻址、寄存器间接寻址、变址寻址、基址寻址等9种寻址方式。并设计算机字长为32位:
64848 OP 目标寻址方式 目标操作数 源寻址方式 源操作数
11.C
12.(1)寄存器
(2)寄存器间接
(3)立即
(4)直接
(5)相对、基址、变址
21
计算机组成原理(第四版)课后习题参考答案
第五章
1. (1)IR、(2)AR、(3)DR、通用寄存器
2. STO R1,(R2)
PC->ARPC0, G, ARi
M->DR
R/W=R
DR->IRDR0, G, ARi
R2->AR
R20, G, ARi
R1->DR
R10, G, DRi
DR->M
R/W=W
3.
LAD (R3), R0
PC->AR
M->DR
DR->IR
R3->AR
R30, G, ARi
M->DR
R/W=R
DR->R0
DR0, G, R0i
4.
22
计算机组成原理(第四版)课后习题参考答案
T1T2T3T4T5QQQQQQQQC1C2C3C4RSETCLRSETCLRSETCLRSETDDD+5V23SETCLRCLR
DSC5脉冲时钟源QQDCLR
5.节拍脉冲T1,T2,T3的宽度实际上等于时钟脉冲的周期或是它的倍数。此处T1 = T2 = 200ns,
T3 = 400ns,所以主脉冲源的频率应为f15MHz。
T 为了消除节拍脉冲上的毛刺,环形脉冲发生器采用移位寄存器形式。图中画出了题目要求的逻辑电路图与时序信号关系图。根据时序信号关系,T1,T2,T3三个节拍脉冲的逻辑表达式如下:
T1C1*C2
T2C2
T3T1
T1用与门实现,T2和T3则用C2的Q端和C1的Q端加非门实现,其目的在于保持信号输出时延时间的一致性并与环形脉冲发生器隔离。
T3
T2
T1QQQQQQC1C2C3RSETCLRSETCLRSETDD+5V23SETCLRQCLRDSC4QD脉冲时钟源CLR
23
计算机组成原理(第四版)课后习题参考答案
1 2 3 4 5 6C4C1C2C3T1T2
T3
6.
(80*31)*32964字节
87. M = G
S3 = H+D+F
S2 = A+B+H+D+E+F+G
S1 = A+B+F+G
C = H+D+Ey+Fy+Gφ
8. 经分析,(d, i, j)和(e, f, h)可分别组成两个小组或两个字段,然后进行译码,可得六个微命令信号,剩下的a, b, c, g四个微命令信号可进行直接控制,其整个控制字段组成如下:
* * * * * * * * a b c g 01d 01e 10 i 10 f
11 j 11 h
9. P1 = 1,按IR6、IR5转移
P2 = 1,按进位C转移
微地址转移逻辑图:
μA8
Q Q
C1
D
μA7SQ Q C2
D
μA6Q Q C3
D
T2
T4
P(1)
μAR8
μAR7
IR6
IR5μAR6
P(2)
IR4
24
计算机组成原理(第四版)课后习题参考答案
10. (1)将C,D两个暂存器直接接到ALU的A,B两个输入端上。与此同时,除C,D外,其余7个寄存器都双向接到单总线上。
移位器IR+1R0R1MDRALUABPC+1MR2R3MARCD
(2)
取指M->MDR->IR,PC+1
测试R1->MDR取源操作数M->MDR->CR2->MDR取目的操作数M->MDR->D加存回修改送回继指令地址C+D->MDRMDR->M,R2->DD+1->R2PC->MAR
11. (1)假设判别测试字段中每一位作为一个判别标志,那么由于有4个转移条件,故该字段为4位。下地址字段为9位,因为控存容量为512单元。微命令字段则是(48-4-9)=35位。
(2)对应上述微指令格式的微程序控制器逻辑框图如图所示。其中微地址寄存器对应下地址字,P字段即为判别测试字段,控制字段即为微命令字段,后两部分组成微指令寄存器。地址转移逻辑的输入是指令寄存器的OP码、各种状态条件以及判别测试字段所给的判别标志(某一位为1),其输出修改微地址寄存器的适当位数,从而实现微程序的分支转移。就是说,此处微指令的后继地址采用断定方式。
25
计算机组成原理(第四版)课后习题参考答案
指令寄存器IROP状态条件…地址译码控制存储器P字段微地址寄存器地址转移逻辑微命令信号…控制字段
12. (1)流水线的操作周期应按各步操作的最大时间来考虑,即流水线时钟周期性max{i}100ns
(2)遇到数据相关时,就停顿第2条指令的执行,直到前面指令的结果已经产生,因此至少需要延迟2个时钟周期。
(3)如果在硬件设计上加以改进,如采用专用通路技术,就可使流水线不发生停顿。
13. (1)
空间S1 2 3 4 5 15 1617 18 19 20WBMEMEXIDIF1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
0 t1t2t3t4t5t6t7t8t920t19t202020…2020时间T
(2)H
n2068.33*10条/秒
9(Kn1)(5201)*100*10 (3)S14.
空间STsnK20*54.17
Tp(Kn1)2051WBEXIDIF
空间S非I2流I1水I2I1线I2I1时时间TI2I1间图 1 2 3 4 5 6 7 8
流水线时时间T间图WBI1EXIDI1I2IFIII123I1I2I3I4I5I2I3I4I5I3I4I5I4I5 1 2 3 4 5 6 7 8
如上两图所示,执行相同的指令,在8个单位时间内,流水计算机完成5条指令,而非
26
计算机组成原理(第四版)课后习题参考答案
流水计算机只完成2条,显然,流水计算机比非流水计算机有更高的吞吐量。
15. 证:设n条指令,K级流水,每次流水时间τ
则用流水实现 Tp = Kτ+(n-1) τ
Hpn
Tpn
Ts非流水实现 Ts = Kτn
HsnHpTpTsKnKnK
nK1HsTpK(n-1)Kn11Tsnn->∞时,
Hp
HsHpn=1时,
1, 则可见n>1时Ts>Tp,故流水线有更高吞吐量
Hs16.(1)写后读 RAW
(2)读后写 WAR
(3)写后写 WAW
17.(1)
译码段I1I3I5I2I2I4I6I6I1执行段写回段I5I2I2I4I4I6I6I1I3I3I3I3I4I2I5I6
(2)
I1I2FFI3I4DDFF取/存 加法器 乘法器
EWEDDI5I6FFEEEDDWEEEEEEWWWW
27
计算机组成原理(第四版)课后习题参考答案
第六章
1. 单总线结构:它是一组总线连接整个计算机系统的各大功能部件,各大部件之间的所有的信息传送都通过这组总线。其结构如图所示。单总线的优点是允许I/O设备之间或I/O设备与内存之间直接交换信息,只需CPU分配总线使用权,不需要CPU干预信息的交换。所以总线资源是由各大功能部件分时共享的。单总线的缺点是由于全部系统部件都连接在一组总线上,所以总线的负载很重,可能使其吞量达到饱和甚至不能胜任的程度。故多为小型机和微型机采用。
系统总线设备接口CPU内存…
多总线结构: 多总线系统结构是通过桥,CPU总线,系统总线和高速总线彼此相连,各大部件的信息传送不是只通过系统总线;体现了高速,中速,低速设备连接到不同的总线上同时进行工作,以提高总线的效率和吞吐量,而且处理器结构的变化不影响高速总线。
设备接口
2. (1)简化了硬件的设计。从硬件的角度看,面向总线是由总线接口代替了专门的I/O接口,由总线规范给出了传输线和信号的规定,并对存储器、I/O设备和CPU如何挂在总线上都作了具体的规定,所以,面向总线的微型计算机设计只要按照这些规定制作CPU插件、存储器插件以及I/O插件等,将它们连入总线即可工作,而不必考虑总线的详细操作。
(2)简化了系统结构。整个系统结构清晰,连线少,底板连线可以印刷化。
(3)系统扩充性好。一是规模扩充,二是功能扩充。规模扩充仅仅需要多插一些同类型的插件;功能扩充仅仅需要按总线标准设计一些新插件。插件插入机器的位置往往没有严格的限制。这就使系统扩充既简单又快速可靠,而且也便于查错。
(4)系统更新性能好。因为CPU、存储器、I/O接口等都是按总线规约挂到总线上的,因而只要总线设计恰当,可以随时随着处理器芯片以及其他有关芯片的进展设计新的插件,新的插件插到底板上对系统进行更新,而这种更新只需更新需要更新的插件,其他插件
28
计算机组成原理(第四版)课后习题参考答案
和底板连线一般不需更改。
3. “A”的ASCII码为41H = 01000001B,1的个数为偶数,故校验位为0;“8”的ASCII码为38H = 00111000B,1的个数为奇数,故校验位为1。
停起数数数数数数数数校停起数数数数数数数数校停止始据据据据据据据据验止始据据据据据据据据验止位位位位位位位位位位位位位位位位位位位位位位位
0 1 2 3 4 5 6 70 1 2 3 4 5 6 7
4. 逻辑图如下:
总线Rout设备一设备二
说明:两个设备共用总线,每个设备的总线接口部分如右图所示。通过锁存器保存接收数据,并通过三态门向总线发送数据。每个设备的Rin控制端有效时,锁存器保存接收数据;每个设备的Rout信号有效时,锁存器保存的数据被送上总线。当Rout信号无效时,设备与总线在电气上断开。
QCPD5.
RinDABSBR设备接口0BG设备接口1中央仲裁器…设备接口n
6.
中央仲裁器
7.
BGnBRnBG1BR1BG0BR0…………设备接口0设备接口1…设备接口n
29
计算机组成原理(第四版)课后习题参考答案
AB仲裁7AB总线iAB0竞争CN7W7CNi设备竞争号WiCN0W0设备竞争号接其它设备
8.C
9.B、A、C
10.A
11.D
12.A
13. 存储总线周期用于对内存读写,I/O总线周期对接口中的端口进行读写。
14.D、C、A、B
15.B、A、E、D、C
16.A、B、C、D
17. PCI总线上有HOST桥、PCI/LAGACY总线桥、PCI/PCI桥。桥在PCI总线体系结构中起着重要作用,它连接两条总线,使彼此间相互通信。桥是一个总线转换部件,可以把一条总线的地址空间映射到另一条总线的地址空间上,从而使系统中任意一个总线主设备都能看到同样的一份地址表。桥可以实现总线间的猝发式传送,可使所有的存取都按CPU的需要出现在总线上。由上可见,以桥连接实现的PCI总线结构具有很好的扩充性和兼容性,允许多条总线并行工作。
18. 分布式仲裁不需要中央仲裁器,每个潜在的主方功能模块都有自己的仲裁号和仲裁器。当它们有总线请求时,把它们唯一的仲裁号发送到共享的仲裁总线上,每个仲裁器将仲裁总线上得到的号与自己的号进行比较。如果仲裁总线上的号大,则它的总线请求不予响应,并撤消它的仲裁号。最后,获胜者的仲裁号保留在仲裁总线上,分布式仲裁是以优先级仲裁策略为基础。
30
计算机组成原理(第四版)课后习题参考答案
AB仲裁7AB总线iAB0竞争CN7W7CNi设备竞争号WiCN0W0设备竞争号接其它设备
19.总线的一次信息传送过程,大致可分为:请求总线,总线仲裁,寻址,信息传送,状态返回。
总线时钟启动信号读命令地址线数据线地址数据认可
20. 设总线带宽用Dr表示,总线时钟周期用T = 1/f表示,一个总线周期传送的数据量用D表示,
根据定义可得:
Dr = T / D = D ×1/f=8B×70 = 560MHz/s
21. PCI总线:是一种不依附于某个具体处理器的局部总线,支持10种外设,并能在高时钟频率下保持高性能。总线时钟频率为33.3MHz/66MHz,最大数据传输速率133MB/s,采用时钟同步方式,与CPU及时钟频率无关,总线宽度32位(5V)/64位(3.3V),能自动识别外设。总线具有与处理器和存储器子系统完全并行操作的能力,具有隐含的中央仲裁系统,采用多路复用方式(地址线和数据线)减少了引脚数,支持64位寻址,具有完全的多总线主控能力。
InfiniBand标准:针对处理器和智能I/O设备之间数据流而提出的一种新体系结构,用于在服务器中取代PCI总线,采用InfiniBand结构将允许服务器提供更高的带宽和可扩展能力,并增强了存储设备扩充的灵活性。InfiniBand允许服务器,远程存储器,其他网络设备接入到一个由开关和链路组成的中央开关网带,可连接多达64000个服务器,存储系统和网络设备。
31
计算机组成原理(第四版)课后习题参考答案
第七章
1.D
2.C、D、C、A
3.1024*1024*2561MB
8*84.格式化容量=扇区容量*每道扇区数*磁道总数
=512*9*100*2=921600B
5.设读写一块信息所需总时间为tB,平均找道时间为ts,平均等待时间为tl,读写一块信息的传输时间为tm,则
tB =
ts+tl+tm
rN个字/秒。
假设磁盘以每秒r转速率旋转,每条磁道容量为N个字,则数据传输率 =
又假设每块的字数为n,因而一旦读写头定位在该块始端,就能在tm(n/rN)秒的时间中传输完毕。
tl是磁盘旋转半周的时间,tl = (1/2r)秒。由此可得:
tBts6.1n[秒]
2rrN185000B/s2775B/转2775B/道
4000转/60s 2*220*2775 = 1.16MB
7.(1)275*12288*4 = 12.89MB
(2) 最高位密度D1按最小磁道半径R1计算(R1 = 115mm):
D1 = 12288字节 / 2πR1 = 17字节 / mm
最低位密度D2按最大磁道半径R2计算:
R2 = R1 + (275 ÷ 5) = 115 + 55 = 170mm
D2 = 12288字节 / 2πR2 = 11.5 字节 / mm
(3)3000*12288600KB/s
60160 (4)**100010ms
2300016 15 14 6 5 4 3 0 (5)
此地址格式表示有4台磁盘,每台有4个记录面,每个记录面最多可容纳512个磁道,每道有16个扇区。
8.
台号柱面(磁道)号盘面(磁头)号扇区号存取时间平均查找时间平均等待时间16060**100072.5ms22400
32
计算机组成原理(第四版)课后习题参考答案
Dr96*9.(1)D2400480KB/s
60C128000字节/秒64000字节/m
2m/sv(2)传送一个数据块所需时间为
t1024字节1秒
128000字节/秒1251s0.016m
125 一个数据块占用长度为
lv*t2m/s* 每块间隙L = 0.014m,数据块总数为
600419867块
lL 故磁带存储器有效存储容量为
19867块*1K字节 = 19867K字节
10.(1)磁盘内径为:9英寸-5英寸 = 4英寸
内层磁道周长为2R2*3.14*531.4英寸
1000位/英寸*31.4英寸 = 3.14*104位 每道信息量 =
磁盘有100道/英寸*5英寸 = 500道
盘片组总容量:20*500*3.14*104 = 3.14*108位 = 314兆位
(2)每转即每道含有信息量3.14*104位,即3.925*103B
1MB/s267转/s16020转/分钟
3.925*103B/转11.(1)[(30*10-3+10*10-3+3000/500*10-3)*2+4*10-3]*1000 = 96s
(2) [(30*10-3+5*10-3+3000/1000*10-3)*2+4*10-3]*1000 =80s
12.
(1)存储容量从大到小依次为:活动头磁盘存储器, MO磁盘,CD-ROM存储器,主存,高速缓存,寄存器组
存储周期从大到小依次为:CD-ROM存储器,MO磁盘,活动头磁盘存储器,主存,高速缓存,寄存器组
(2)可构成如下的多级存储体系:
寄存器组
高速缓存
主存
活动头硬磁盘
MO磁盘和CD-ROM存储器
1
2
3
33
计算机组成原理(第四版)课后习题参考答案
(3)CPU和高速缓存以及CPU和主存之间有直接的数据通路,而CPU与外存之间不存在直接的数据通路,CPU访问硬盘和光盘时都需要先将信息调入主存。
13.刷新存储器是用来存储一图像信息以不断提供刷新图像的信号。其存储容量由图像分辨率和灰度级决定。
1024*1024*24bit = 3MB
14.(1)1024*768*3 = 2.25MB
(2)1024*768*3B*72/s = 162MB/s
34
计算机组成原理(第四版)课后习题参考答案
第八章
1.A、B、C
2.B
3.A
4.C
5.组织外围设备和内存进行数据传输;控制外围设备;选择;数组多路;字节多路
6.能响应,因为设备A的优先级比设备B高。若要设备B总能立即得到服务,可将设备B从第二级取出来,单独放在第三级上,使第三级的优先级最高,即令IM3 = 0。
7.依次处理设备A,设备D,设备G的时间为:
T1 = t1+t2+t3+t4+tA
T2 = t1+t2+t3+t4+tD
T3 = t1+t2+t3+t4+tG
总时间为T = T1+T2+T3 = 3*( t1+t2+t3+t4)+ tA + tD + tG
8.(1)
中断处理程序L0中断处理程序L1中断处理程序L2中断处理程序L3中断处理程序L4中断处理程序L0级01111中断处理级屏蔽位L1级L2级L3级111L4级00000
(2)
主程序L1L2L3L4L5
9.要将通用寄存器内容保存到主存中去。只需保存中断处理程序用到的那2个寄存器内容。
10. 设计思想:二维中断判优结构如主教材图8.9(b)所示。其中,主优先级独立请求方式的判优电路在主教材图8.10的基础上进行改进:将PSW中的5~7三位经译码器输出IR4~IR7共四个请求信号,参与排队器排队。
11.(1)IM2IM1IM0 = 011
(2) IM2IM1IM0 = 001
35
计算机组成原理(第四版)课后习题参考答案
(3) 若要设备B总能立即得到服务,可将设备B从第二级取出来,单独放在第三级上,使第三级的优先级最高,即令IM3 = 0。
12.D
13.中断、蔽中断、中断、异常、异常、执行软件中断指令
14.B、A、C、D、E
15.B、A、
16.(1)通道方式:可以实现对外设的统一管理和外设与内存之间的数据传送,大大提高了CPU
的工作效率。
(2)DMA方式:数据传送速度很高,传送速率仅受到内存访问时间的限制。需要更多硬件,,适用于内存和高速外设之间大批数据交换的场合。
(3)中断方式:一般适用于随机出现的服务,且一旦提出要求应立即进行,节省了CPU的时间开销,但硬件结构稍复杂一些。
17.
光盘软盘打印机DMA
控制器20us90us180us
18.主端口是1394树形配置结构的根节点。一个主端口最多可连接63台设备每个设备称为一个节点,它们构成亲子关系。其中右侧按菊花链式配置,左侧按亲子关系连接。
36
计算机组成原理(第四版)课后习题参考答案
第九章
1. B
2. D
3. B、D
4. A、C、D
5. D
6.6
7. 虚拟地址为30位,物理地址为22位。
页表长度:1GB256K
4KB8.
(1)若页表存放在主存中,则要实现一次页面访问需两次访问主存:一次是访问页表,确定所存取页面的物理地址;第二次才根据该地址存取页面数据。故访问一次主存的时间为50×2=100(ns)
(2)75%×50+(1-75%)×2×50=62.5(ns)
9.
被访问的字在cache中的概率为0.9
不在cache中但在主存中的概率为(1-0.9)×0.6=0.06
不在cache中也不在主存中的概率为(1-0.9) ×(1-0.6)=0.04
则一个字的平均访问时间为:15×0.9+(15+60)×0.06+(15+60+10×106) ×0.04=400021 ns
10.
页内地址11位。
逻辑地址:4+11=15位。
物理地址空间大小为8×2K=16KB
11
页内地址10位。
虚地址(0AC5)16=(00010 1011000101)2处于虚地址第2页,调入到主存第4页中,故物理地址为(00100 1011000101)2=(12C5)16
虚地址(1AC5)16=(00110 1011000101)2处于虚地址第6页,尚未调入到主存中,故无物理地址。
12. 虚存管理是由软件(操作系统)和硬件共同完成,由于软件的介入,虚存对实现存储管理的系统程序不透明。而段是按照程序的自然分界划分的长度可以动态改变的区域。通常,程序员把子程序、操作数和常数等不同类型的数据划分到不同的段中,并且每个程序可以有多个相同类型的段。由于分段是由程序员完成的,故段式虚拟存储器对应用程序员而言是不完全透明的。但虚存到实存的地址映射是由系统软件辅助完成的,故对应用程序而言,段式虚存是“半透明”的。
13. 在一个进程的执行过程中,有些页面处在主存中,有些处在辅存中。
14.由于页式虚拟存储器的页大小固定,且为2的整数次幂(设为2n),故页起始地址一定处在页边界上(页起始地址的最低n位必为全0),页内地址可以用物理地址的低n位直接给出。而段式虚存中,段的大小可变,且段可起始于任意地址,故必须通过段首址与段内偏移量相加才能得到物理地址。
15 答:颠簸是由缺页率高而引起的。
37
计算机组成原理(第四版)课后习题参考答案
防止颠簸的办法:系统规定缺页率的上界和下界。当运行进程缺页率高于上界时,表明所分给它的物理页面数过少,应当增加;反之,当运行进行缺页率低于下界时,表明所分给它的物理页面数过多,可以减少。这样,根据缺页率反馈可动态调整物理页面的分配,以防止颠簸的发生。
38
计算机组成原理(第四版)课后习题参考答案
第十章
1. D
2. 214=16384
3.
ld8 r1=[r3]
add r6=r8, r9;;
sub r3=r1, r4;;
add r5=r3, r7
4.
5.
ld8.s r3=[r5]
……
br next1 //转移至标号next1执行
chk.s r3, err_recov
sub r2=r1, r3
6. 与多核处理机相比,多线程技术仅仅在单核单线程处理机的基础上增加了很少的成本就显著提高了系统性能,因而是一种提高并行性的比较经济的手段。而多核处理机是将多个处理机核封装在一个芯片内部,处理机成本显著增加。
由于同时运行的多个线程需要共享执行资源,因而在超线程处理机中实时调度机制非常复杂。如果多个线程同时需要某一个共享资源,只有一个线程能够使用该资源,其他线程要暂停并等待资源空闲时才能继续。因此,同时多线程技术就性能提升而言远不能等同于多个相同时钟频率处理机组合而成的多核处理机,但从性能-价格比的角度看,同时多线程技术
39
计算机组成原理(第四版)课后习题参考答案
是一种对单线程处理机执行资源的有效优化手段。
7.
Inst 1
Inst 2
P1, P2=a, b
(P1) Inst 5
(P1) Inst 6
(P2) Inst 5
(P2) Inst 3
(P1) Inst 4
Inst 7
Inst 8
8.
去掉分支指令后,只需要两个时钟周期完成上述功能,描述如下:
clock 1: if (a > b) then P1=TRUE else P2= TRUE
clock 2: (P1)x=a; (P2)x=b; (P1)y=6; (P2)y=y+5
9.
超线程技术是在原有单线程处理机的基础上增加少量成本(复制必要的线程上下文相关的部件),允许处理机在同一个周期从不同的线程取指令发射执行。不同的线程共享同一个流水线。超线程技术能够有效地提高芯片上的资源利用率,但资源冲突会限制处理机的并行操作能力。
多核处理机技术把多个独立的处理机核集成到同一个芯片之上,利用片上更高的通信带宽和更短的通信时延,挖掘出线程级的更高并行性。由于多个处理机核相互独立,故在运行多个线程时不会引起资源竞争。
超标量流水技术是在单个处理机内部设置多条指令流水线,每条流水线有自己独立的ALU、地址生成部件和cache接口等,从而支持单一的指令流中的若干指令的并行执行。但当单一的指令流出现cache不命中等现象时,会使流水线断流;而指令之间的相关性也会严重影响执行单元的利用率。
虚拟化技术可以同时运行多个操作系统,而且每一个操作系统中都有多个程序运行,每一个操作系统都运行在一个虚拟的CPU或者是虚拟主机上。支持虚拟化技术的CPU带有特别优化过的指令系统来控制虚拟过程。
多任务机制是指在一个操作系统中多个程序同时并行运行。操作系统软件可以通过任务调度机制切换处理机时间,从而降低处理机因为等待资源可用造成的延迟。
10. 从理论上讲,流水线的级数越多,并行工作的功能段数就越多,单位时间内执行的指令数就越多,系统吞吐量就越高。但流水线深度过深也带来了一定副作用,导致初始时延过长,硬件资源消耗过大,段间缓冲的开销变大,一旦流水线断流也将会造成非常大的损失。因此,需要根据处理机体现结构合理安排流水线的级数。
40
版权声明:本文标题:计算机组成原理(第四版)课后习题答案 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1703147161h439898.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论