国产91精品一区二区绿帽-欧美淫欲视频-一起艹在线观看-国产高清在线一区-91精品在线免费-久久2017国产视频-中文一区二区-国产麻豆免费观看-国产黄色在线看-久久精品www人人爽人人-91红桃视频-成在人线av无码免费看网站直播-超碰123-黄色欧美视频-国产第一页视频-特级黄色大片-欧美性色婷婷久久久精品

歡迎光臨機(jī)房365,我們竭誠(chéng)為您提供功能全方位提供機(jī)房解決方案!

關(guān)于我們 品牌優(yōu)勢(shì) 服務(wù)支持 聯(lián)系我們

精密空調(diào)|機(jī)房精密空調(diào)|機(jī)房專用空調(diào)-機(jī)房365

旗下欄目: 存儲(chǔ)資訊 存儲(chǔ)產(chǎn)品 存儲(chǔ)售后

計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)簡(jiǎn)史

發(fā)布時(shí)間:2018-03-19 15:24:23   點(diǎn)擊:
在國(guó)際范圍內(nèi),對(duì)硅半導(dǎo)體的資料科學(xué),制作工藝,有才能也有志愿繼續(xù)的廠商可能只留下了Intel,Samsung,TSMC與Global Foundries。在近期

在國(guó)際范圍內(nèi),對(duì)硅半導(dǎo)體的資料科學(xué),制作工藝,有才能也有志愿繼續(xù)的廠商可能只留下了Intel,Samsung,TSMC與Global Foundries。在近期或許在不久的將來(lái),或許我國(guó)為了完結(jié)國(guó)際工廠的巨大轉(zhuǎn)型,將接過(guò)半導(dǎo)體生產(chǎn)制作的旗號(hào),使其愈加廉價(jià),使其愈加缺少必要的盈余以支撐整個(gè)產(chǎn)業(yè)鏈的繼續(xù)開(kāi)展,維系也在完結(jié)這個(gè)職業(yè)。我繼續(xù)悲觀地維持在幾年前的判斷[3],根據(jù)硅的半導(dǎo)體工業(yè)不可或缺,也不再重要。談核算

緣起于上世紀(jì)四十年代的馮諾依曼系統(tǒng)正在等待著最終一根稻草。至今處理器的規(guī)劃者再也無(wú)法依照自身的理念決議自己的規(guī)劃方向,當(dāng)這些處理器的規(guī)劃者不知道做什么適宜,而回身專心于Cache、內(nèi)存與I/O通路時(shí),根據(jù)馮諾依曼系統(tǒng)的傳統(tǒng)處理器現(xiàn)實(shí)上現(xiàn)已完畢。把握用戶場(chǎng)景與運(yùn)用的廠商現(xiàn)在是處理器真實(shí)的規(guī)劃主導(dǎo)者。定制化時(shí)代不再是多年之前的預(yù)判[4],而是已然降臨,并操縱著處理器規(guī)劃的方向。

硅半導(dǎo)體與傳統(tǒng)處理器的停滯不前,不會(huì)完畢人類關(guān)于硅的依靠,在短期內(nèi)尚無(wú)任何資料能夠完全代替硅。運(yùn)用關(guān)于硅的需求仍然清晰。在一分鐘內(nèi),Youtube將至少接納長(zhǎng)達(dá)100個(gè)小時(shí)的視頻文件[5];在Facebook上,每天有40億次視頻點(diǎn)擊播映[6]。這些運(yùn)用需求將經(jīng)過(guò)網(wǎng)絡(luò),抵達(dá)各類效勞器,并從存儲(chǔ)器中獲取或許寫(xiě)入數(shù)據(jù),進(jìn)行著各類數(shù)據(jù)的處理。在核算、網(wǎng)絡(luò)與存儲(chǔ)這些根底架構(gòu)中,硅半導(dǎo)體仍然占有主導(dǎo)地位。

奇特的半導(dǎo)體硅改變了人類前史的開(kāi)展軌道,也簡(jiǎn)直走到了盡頭。近半個(gè)世紀(jì)以來(lái),硅一向有互補(bǔ)品,如砷化鎵GaAs與氮化鎵GaN,這些在大功率與高頻范疇已有著嚴(yán)重運(yùn)用的半導(dǎo)體資料無(wú)法代替硅,根據(jù)二硫化鉬MoS2和碳納米管CNT (Carbon Nanotube)的晶體管乃至能夠?qū)ate Length做到1nm[7],可是仍然處于實(shí)驗(yàn)室階段,用其代替硅只是停留在論文的紙面之上。至今硅工業(yè)的天花板制約了整個(gè)IT根底設(shè)施職業(yè)行進(jìn)的腳步。

在核算范疇,被軟銀收買的ARM現(xiàn)已難以對(duì)x86處理器帶來(lái)繼續(xù)的壓力。在手機(jī)處理器上取得了長(zhǎng)足進(jìn)步的蘋(píng)果、高通、三星與華為,在近期難以在效勞器市場(chǎng)上對(duì)Intel帶來(lái)實(shí)質(zhì)性的應(yīng)戰(zhàn)。許多ARM效勞器在SPECInt的測(cè)驗(yàn)中聲稱已逐步接近了x86處理器,卻在有意無(wú)意的疏忽著一個(gè)清楚明了的現(xiàn)實(shí),這一代的效勞器,乃至是手機(jī)處理器,都不應(yīng)該繼續(xù)關(guān)注SPECInt與SPECfp這類單純比拼核算功能的基準(zhǔn)測(cè)驗(yàn)。

現(xiàn)在處理器的規(guī)劃中心現(xiàn)已轉(zhuǎn)向I/O與Memory Hierarchy通路的建設(shè)。在Intel的Broadwell-E處理器的Die Map[8]中,10個(gè)處理器微架構(gòu)(Core)合在一起所占的份額現(xiàn)已不算太大,Memory Hierarchy與I/O占有了大多數(shù)的Die資源。

image2

圖12 Intel的Broadwell-E處理器的Die Map[8]

在一個(gè)處理器微架構(gòu)中,運(yùn)算單元所占的份額簡(jiǎn)直能夠疏忽不計(jì),在處理器微架構(gòu)中,仍然是品種繁復(fù),各類數(shù)據(jù)緩沖占有著主導(dǎo)方位?,F(xiàn)實(shí)上,除了模仿器材以及與模仿器材強(qiáng)相關(guān)的芯片外,在多數(shù)芯片Die Map中,緩沖都占有著要害方位。迄今為止,核算范疇的多數(shù)運(yùn)用對(duì)處理器的運(yùn)用都是訪存密集型。

處理器的規(guī)劃初衷本是為核算效勞,可是在今天的許多運(yùn)用場(chǎng)景中,處理器所承當(dāng)更多的使命是經(jīng)過(guò)各類I/O設(shè)備獲取數(shù)據(jù);這些數(shù)據(jù)在穿越Memory Hierarchy后抵達(dá)CPU的中心部件;CPU中心部件在準(zhǔn)確核算著心跳的過(guò)程中,盡可能地快速處理這些數(shù)據(jù),然后將其再次轉(zhuǎn)發(fā)至遠(yuǎn)方。和密集核算相關(guān)的使命,現(xiàn)現(xiàn)已過(guò)各類硬件加快引擎,GPU或許專用ASIC完成。

咱們無(wú)法直面一個(gè)簡(jiǎn)略而令人懊喪的現(xiàn)實(shí),在處理器運(yùn)轉(zhuǎn)著的各類協(xié)議棧的代碼組成中,用于完成快速路徑的代碼可能不超越1%;99%以上的用于反常處理的代碼,能夠在超越99.9%以上的時(shí)間段內(nèi)安然入眠,其存在只為等待著可能的反常呈現(xiàn)。

不是由于這些數(shù)不勝數(shù)的反常需求處理,或許咱們這個(gè)國(guó)際現(xiàn)已不再需求通用處理器了。從純核算的角度上剖析,各類硬件加快引擎,GPU、FPGA或許專用ASIC,遠(yuǎn)勝今天的處理器,可是這些加快引擎在面臨不計(jì)其數(shù)種反常時(shí)力不從心。在移動(dòng)互聯(lián)網(wǎng)廠商的數(shù)據(jù)中心中,處理器存在的最首要意圖是對(duì)各類數(shù)據(jù)流進(jìn)行剖析、拼裝、打包后發(fā)往下一站。

在這些運(yùn)用場(chǎng)景中,處理器存在的首要原因仍然不是其高效的報(bào)文轉(zhuǎn)發(fā)才能,而是能夠應(yīng)對(duì)在報(bào)文處理過(guò)程中呈現(xiàn)的各類反常。在數(shù)據(jù)中心中,處理器存在的首要效果是能夠相對(duì)高效地處理數(shù)據(jù)報(bào)文,一起還能對(duì)各類反常進(jìn)行查漏補(bǔ)缺。不僅在核算范疇,在IT根底設(shè)施的網(wǎng)絡(luò)與存儲(chǔ)范疇,通用處理器的運(yùn)用方法仍然如此。

能夠?qū)νㄓ锰幚砥鲙?lái)應(yīng)戰(zhàn)的GPU,遠(yuǎn)景沒(méi)有想象中樂(lè)觀。從規(guī)劃戰(zhàn)略上看,GPU與通用處理器的最大差異在于對(duì)反常的處理。GPU專心極致核算,盡最大的可能提高TLP (Thread-Level Parallelism),而疏忽反常處理;通用處理器需求考慮反常狀態(tài)的處理,以追求更大的適用性。

在不同規(guī)劃戰(zhàn)略的引導(dǎo)下,GPU走出了一條與通用處理器懸殊的路途。Nvidia的Pascal GP100由最多可達(dá)6個(gè)的一組GPC (Graphics Processing Clusters)構(gòu)建;這些GPC共享同一個(gè)4096 KB的L2 Cache;經(jīng)過(guò)8個(gè)512位的Memory Controller對(duì)外交流數(shù)據(jù);運(yùn)用高速的NVLink接口與其他GP100互聯(lián);最終經(jīng)過(guò)PCIe 3.0總線與通用處理器進(jìn)行銜接[9]。

image3

圖13 Nvidia Pascal GP100 GPU組成結(jié)構(gòu)[9]

在每一個(gè)GPC中,最多能夠包容5個(gè)TPC (Texture Processing Clusters);每個(gè)TPC中集成兩個(gè)SM (Streaming Multiprocessors);每一個(gè)SM包括64個(gè)CUDA和4個(gè)TU (Texture Unit)。其間最基本的CUDA中心和TU數(shù)目別離可達(dá)3840與個(gè)240個(gè)。GPU的Die Size可達(dá)610mm2,所能包容的晶體管數(shù)目可達(dá)153億個(gè)[9]。

GPU與通用處理器,是規(guī)劃者在面臨有限的Die Size資源,做出的不同挑選,以適用于不同的運(yùn)用場(chǎng)景。由數(shù)目繁復(fù)的運(yùn)算單元所組成的GPU,其組成結(jié)構(gòu)不比通用處理器雜亂,反而更為簡(jiǎn)略??墒沁@無(wú)法解釋,Intel能夠做出更為雜亂的通用處理器,卻在高端GPU范疇上重復(fù)折戟沉沙;也無(wú)法解釋,效勞器級(jí)處理器的規(guī)劃難度超越手機(jī)處理器,Intel仍然百戰(zhàn)百勝。

通用處理器需求處理各類已知與不知道的反常,在進(jìn)行核算的一起,不斷地處理各類分支跳轉(zhuǎn)語(yǔ)句;隨時(shí)預(yù)備應(yīng)對(duì)各類中止事情;與此一起需求具有大規(guī)劃的數(shù)據(jù)吞吐才能;也因此通用處理器需求一個(gè)規(guī)劃龐大的通用操作系統(tǒng)。至今,核算已是通用處理器中的一個(gè)微小組成模塊,通用處理器中最大的模塊,是各類Cache和與其緊密聯(lián)系在一起的Memory Hierarchy。

GPU聚焦的核算國(guó)際相對(duì)單純;所處理的數(shù)據(jù)規(guī)整;數(shù)據(jù)間簡(jiǎn)直沒(méi)有太多的依靠;不需求辦理外部設(shè)備,不需求處理各類中止與反常,也不需求一個(gè)操作系統(tǒng)。從GPU的開(kāi)展前史上,能夠發(fā)現(xiàn),GPU所處理的圖畫(huà)數(shù)據(jù)并不具有十分強(qiáng)的Locality特性。在GPU中,Cache存在的首要效果不是為了保存需求重復(fù)運(yùn)用的數(shù)據(jù),而是為了補(bǔ)償GPU內(nèi)部運(yùn)算部件與外部DRAM之間的拜訪推遲,然后沒(méi)有如通用處理器那樣的,雜亂程度令人拍案叫絕的Cache Hierarchy結(jié)構(gòu)。

在GPU中,存在與通用處理器相似的流水線,Nvidia的GP100中的基本組成模塊SM,自身就是也是一個(gè)流水線,這個(gè)流水線也被稱為Graphics Pipeline,在不考慮光柵化處理的場(chǎng)景下,Graphics Pipeline也被稱為Rendering Pipeline。

注:文章內(nèi)容和圖片均來(lái)源于網(wǎng)絡(luò),只起到信息的傳遞,不是用于商業(yè),如有侵權(quán)請(qǐng)聯(lián)系刪除!

最火資訊

上犹县| 嵩明县| 广昌县| 许昌市| 巨野县| 河曲县| 淮南市| 苍溪县| 喀喇| 平泉县| 玉山县| 德阳市| 永州市| 平南县| 封丘县| 襄汾县| 会理县| 宜黄县| 朔州市| 潼关县| 顺平县| 金阳县| 汽车| 拜城县| 吉木乃县| 曲松县| 麟游县| 龙门县| 红桥区| 平利县| 江川县| 威信县| 漾濞| 东海县| 海淀区| 永宁县| 正阳县| 永顺县| 得荣县| 威信县| 大厂|