欧美日韩不卡在线,国产污视频在线播放,国产资源在线免费观看

在國(guó)際范圍內(nèi)，對(duì)硅半導(dǎo)體的資料科學(xué)，制作工藝，有才能也有志愿繼續(xù)的廠商可能只留下了Intel，Samsung，TSMC與Global Foundries。在近期或許在不久的將來(lái)，或許我國(guó)為了完結(jié)國(guó)際工廠的巨大轉(zhuǎn)型，將接過(guò)半導(dǎo)體生產(chǎn)制作的旗號(hào)，使其愈加廉價(jià)，使其愈加缺少必要的盈余以支撐整個(gè)產(chǎn)業(yè)鏈的繼續(xù)開(kāi)展，維系也在完結(jié)這個(gè)職業(yè)。我繼續(xù)悲觀地維持在幾年前的判斷[3]，根據(jù)硅的半導(dǎo)體工業(yè)不可或缺，也不再重要。談核算

緣起于上世紀(jì)四十年代的馮諾依曼系統(tǒng)正在等待著最終一根稻草。至今處理器的規(guī)劃者再也無(wú)法依照自身的理念決議自己的規(guī)劃方向，當(dāng)這些處理器的規(guī)劃者不知道做什么適宜，而回身專心于Cache、內(nèi)存與I/O通路時(shí)，根據(jù)馮諾依曼系統(tǒng)的傳統(tǒng)處理器現(xiàn)實(shí)上現(xiàn)已完畢。把握用戶場(chǎng)景與運(yùn)用的廠商現(xiàn)在是處理器真實(shí)的規(guī)劃主導(dǎo)者。定制化時(shí)代不再是多年之前的預(yù)判[4]，而是已然降臨，并操縱著處理器規(guī)劃的方向。

硅半導(dǎo)體與傳統(tǒng)處理器的停滯不前，不會(huì)完畢人類關(guān)于硅的依靠，在短期內(nèi)尚無(wú)任何資料能夠完全代替硅。運(yùn)用關(guān)于硅的需求仍然清晰。在一分鐘內(nèi)，Youtube將至少接納長(zhǎng)達(dá)100個(gè)小時(shí)的視頻文件[5]；在Facebook上，每天有40億次視頻點(diǎn)擊播映[6]。這些運(yùn)用需求將經(jīng)過(guò)網(wǎng)絡(luò)，抵達(dá)各類效勞器，并從存儲(chǔ)器中獲取或許寫(xiě)入數(shù)據(jù)，進(jìn)行著各類數(shù)據(jù)的處理。在核算、網(wǎng)絡(luò)與存儲(chǔ)這些根底架構(gòu)中，硅半導(dǎo)體仍然占有主導(dǎo)地位。

奇特的半導(dǎo)體硅改變了人類前史的開(kāi)展軌道，也簡(jiǎn)直走到了盡頭。近半個(gè)世紀(jì)以來(lái)，硅一向有互補(bǔ)品，如砷化鎵GaAs與氮化鎵GaN，這些在大功率與高頻范疇已有著嚴(yán)重運(yùn)用的半導(dǎo)體資料無(wú)法代替硅，根據(jù)二硫化鉬MoS2和碳納米管CNT (Carbon Nanotube)的晶體管乃至能夠?qū)ate Length做到1nm[7]，可是仍然處于實(shí)驗(yàn)室階段，用其代替硅只是停留在論文的紙面之上。至今硅工業(yè)的天花板制約了整個(gè)IT根底設(shè)施職業(yè)行進(jìn)的腳步。

在核算范疇，被軟銀收買的ARM現(xiàn)已難以對(duì)x86處理器帶來(lái)繼續(xù)的壓力。在手機(jī)處理器上取得了長(zhǎng)足進(jìn)步的蘋(píng)果、高通、三星與華為，在近期難以在效勞器市場(chǎng)上對(duì)Intel帶來(lái)實(shí)質(zhì)性的應(yīng)戰(zhàn)。許多ARM效勞器在SPECInt的測(cè)驗(yàn)中聲稱已逐步接近了x86處理器，卻在有意無(wú)意的疏忽著一個(gè)清楚明了的現(xiàn)實(shí)，這一代的效勞器，乃至是手機(jī)處理器，都不應(yīng)該繼續(xù)關(guān)注SPECInt與SPECfp這類單純比拼核算功能的基準(zhǔn)測(cè)驗(yàn)。

現(xiàn)在處理器的規(guī)劃中心現(xiàn)已轉(zhuǎn)向I/O與Memory Hierarchy通路的建設(shè)。在Intel的Broadwell-E處理器的Die Map[8]中，10個(gè)處理器微架構(gòu)(Core)合在一起所占的份額現(xiàn)已不算太大，Memory Hierarchy與I/O占有了大多數(shù)的Die資源。

圖12 Intel的Broadwell-E處理器的Die Map[8]

在一個(gè)處理器微架構(gòu)中，運(yùn)算單元所占的份額簡(jiǎn)直能夠疏忽不計(jì)，在處理器微架構(gòu)中，仍然是品種繁復(fù)，各類數(shù)據(jù)緩沖占有著主導(dǎo)方位?，F(xiàn)實(shí)上，除了模仿器材以及與模仿器材強(qiáng)相關(guān)的芯片外，在多數(shù)芯片Die Map中，緩沖都占有著要害方位。迄今為止，核算范疇的多數(shù)運(yùn)用對(duì)處理器的運(yùn)用都是訪存密集型。

處理器的規(guī)劃初衷本是為核算效勞，可是在今天的許多運(yùn)用場(chǎng)景中，處理器所承當(dāng)更多的使命是經(jīng)過(guò)各類I/O設(shè)備獲取數(shù)據(jù)；這些數(shù)據(jù)在穿越Memory Hierarchy后抵達(dá)CPU的中心部件；CPU中心部件在準(zhǔn)確核算著心跳的過(guò)程中，盡可能地快速處理這些數(shù)據(jù)，然后將其再次轉(zhuǎn)發(fā)至遠(yuǎn)方。和密集核算相關(guān)的使命，現(xiàn)現(xiàn)已過(guò)各類硬件加快引擎，GPU或許專用ASIC完成。

咱們無(wú)法直面一個(gè)簡(jiǎn)略而令人懊喪的現(xiàn)實(shí)，在處理器運(yùn)轉(zhuǎn)著的各類協(xié)議棧的代碼組成中，用于完成快速路徑的代碼可能不超越1%；99%以上的用于反常處理的代碼，能夠在超越99.9%以上的時(shí)間段內(nèi)安然入眠，其存在只為等待著可能的反常呈現(xiàn)。

不是由于這些數(shù)不勝數(shù)的反常需求處理，或許咱們這個(gè)國(guó)際現(xiàn)已不再需求通用處理器了。從純核算的角度上剖析，各類硬件加快引擎，GPU、FPGA或許專用ASIC，遠(yuǎn)勝今天的處理器，可是這些加快引擎在面臨不計(jì)其數(shù)種反常時(shí)力不從心。在移動(dòng)互聯(lián)網(wǎng)廠商的數(shù)據(jù)中心中，處理器存在的最首要意圖是對(duì)各類數(shù)據(jù)流進(jìn)行剖析、拼裝、打包后發(fā)往下一站。

在這些運(yùn)用場(chǎng)景中，處理器存在的首要原因仍然不是其高效的報(bào)文轉(zhuǎn)發(fā)才能，而是能夠應(yīng)對(duì)在報(bào)文處理過(guò)程中呈現(xiàn)的各類反常。在數(shù)據(jù)中心中，處理器存在的首要效果是能夠相對(duì)高效地處理數(shù)據(jù)報(bào)文，一起還能對(duì)各類反常進(jìn)行查漏補(bǔ)缺。不僅在核算范疇，在IT根底設(shè)施的網(wǎng)絡(luò)與存儲(chǔ)范疇，通用處理器的運(yùn)用方法仍然如此。

能夠?qū)νㄓ锰幚砥鲙?lái)應(yīng)戰(zhàn)的GPU，遠(yuǎn)景沒(méi)有想象中樂(lè)觀。從規(guī)劃戰(zhàn)略上看，GPU與通用處理器的最大差異在于對(duì)反常的處理。GPU專心極致核算，盡最大的可能提高TLP (Thread-Level Parallelism)，而疏忽反常處理；通用處理器需求考慮反常狀態(tài)的處理，以追求更大的適用性。

在不同規(guī)劃戰(zhàn)略的引導(dǎo)下，GPU走出了一條與通用處理器懸殊的路途。Nvidia的Pascal GP100由最多可達(dá)6個(gè)的一組GPC (Graphics Processing Clusters)構(gòu)建；這些GPC共享同一個(gè)4096 KB的L2 Cache；經(jīng)過(guò)8個(gè)512位的Memory Controller對(duì)外交流數(shù)據(jù)；運(yùn)用高速的NVLink接口與其他GP100互聯(lián)；最終經(jīng)過(guò)PCIe 3.0總線與通用處理器進(jìn)行銜接[9]。

圖13 Nvidia Pascal GP100 GPU組成結(jié)構(gòu)[9]

在每一個(gè)GPC中，最多能夠包容5個(gè)TPC (Texture Processing Clusters)；每個(gè)TPC中集成兩個(gè)SM (Streaming Multiprocessors)；每一個(gè)SM包括64個(gè)CUDA和4個(gè)TU (Texture Unit)。其間最基本的CUDA中心和TU數(shù)目別離可達(dá)3840與個(gè)240個(gè)。GPU的Die Size可達(dá)610mm2，所能包容的晶體管數(shù)目可達(dá)153億個(gè)[9]。

GPU與通用處理器，是規(guī)劃者在面臨有限的Die Size資源，做出的不同挑選，以適用于不同的運(yùn)用場(chǎng)景。由數(shù)目繁復(fù)的運(yùn)算單元所組成的GPU，其組成結(jié)構(gòu)不比通用處理器雜亂，反而更為簡(jiǎn)略?？墒沁@無(wú)法解釋，Intel能夠做出更為雜亂的通用處理器，卻在高端GPU范疇上重復(fù)折戟沉沙；也無(wú)法解釋，效勞器級(jí)處理器的規(guī)劃難度超越手機(jī)處理器，Intel仍然百戰(zhàn)百勝。

通用處理器需求處理各類已知與不知道的反常，在進(jìn)行核算的一起，不斷地處理各類分支跳轉(zhuǎn)語(yǔ)句；隨時(shí)預(yù)備應(yīng)對(duì)各類中止事情；與此一起需求具有大規(guī)劃的數(shù)據(jù)吞吐才能；也因此通用處理器需求一個(gè)規(guī)劃龐大的通用操作系統(tǒng)。至今，核算已是通用處理器中的一個(gè)微小組成模塊，通用處理器中最大的模塊，是各類Cache和與其緊密聯(lián)系在一起的Memory Hierarchy。

GPU聚焦的核算國(guó)際相對(duì)單純；所處理的數(shù)據(jù)規(guī)整；數(shù)據(jù)間簡(jiǎn)直沒(méi)有太多的依靠；不需求辦理外部設(shè)備，不需求處理各類中止與反常，也不需求一個(gè)操作系統(tǒng)。從GPU的開(kāi)展前史上，能夠發(fā)現(xiàn)，GPU所處理的圖畫(huà)數(shù)據(jù)并不具有十分強(qiáng)的Locality特性。在GPU中，Cache存在的首要效果不是為了保存需求重復(fù)運(yùn)用的數(shù)據(jù)，而是為了補(bǔ)償GPU內(nèi)部運(yùn)算部件與外部DRAM之間的拜訪推遲，然后沒(méi)有如通用處理器那樣的，雜亂程度令人拍案叫絕的Cache Hierarchy結(jié)構(gòu)。

在GPU中，存在與通用處理器相似的流水線，Nvidia的GP100中的基本組成模塊SM，自身就是也是一個(gè)流水線，這個(gè)流水線也被稱為Graphics Pipeline，在不考慮光柵化處理的場(chǎng)景下，Graphics Pipeline也被稱為Rendering Pipeline。

注：文章內(nèi)容和圖片均來(lái)源于網(wǎng)絡(luò)，只起到信息的傳遞，不是用于商業(yè)，如有侵權(quán)請(qǐng)聯(lián)系刪除！

歡迎光臨機(jī)房365，我們竭誠(chéng)為您提供功能全方位提供機(jī)房解決方案！

首頁(yè) > 存儲(chǔ) > 存儲(chǔ)資訊 >

計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)簡(jiǎn)史

頻道精選

欄目導(dǎo)航

最火資訊

聯(lián)系我們