XILINX 63234 END FPGA dreifingaraðili
Mikilvæg athugasemd: Þessi niðurhalanlega PDF af svarskrá er veitt til að auka notagildi hennar og læsileika. Það er mikilvægt að hafa í huga að Answer Records eru það Web-bundið efni sem er uppfært reglulega þegar nýjar upplýsingar verða tiltækar. Þér er bent á að heimsækja tæknilega aðstoð Xilinx Websíða og afturview (Xilinx svar 63234) fyrir nýjustu útgáfuna af þessu svari.
Inngangur
Vegna þess hvernig DDR2 og DDR3 minni eru uppbyggð og MIG 7 serían stýringin er hönnuð, er afköstin ekki einföld. Það krefst skilnings á ýmsum Jedec tímasetningarbreytum og stýringararkitektúr, og þú þarft að keyra hermir til að fá matið. Almenna meginreglan fyrir að ákvarða afköst er sú sama, en þetta skjal veitir auðvelda leið til að ná fram skilvirkni með því að nota MIG ex.amphönnun með hjálp prófunarbekkjar og örvunar filefylgir hér með.
Árangursrík bandbreidd
DRAM gagnarútan nær aðeins hámarksbandvídd við lestrar- og skrifalotur, og yfirálag hennar lækkar virkan gagnahraða.
Nokkrir fyrrvampminni kostnaður er
- forhleðslutími með aðgangi að línum í sama banka (aðgangsheimilisfang er ekki í sama línu-síðu höggi)
- endurheimtartími skrifa til að breyta úr skrifaðgangi yfir í lesaðgang
- Afgreiðslutími strætisvagns til að breyta úr lesaðgangi í skrifaðgang
Klukkuhringrásir sem flytja gögn
- Skilvirkni (%) = ———————————————-
Heildar klukkuhringrásir
Virk bandbreidd = hámarksbandbreidd * Skilvirkni
MIG Design Generation
- Sjá UG586 kafla 1 fyrir skref-fyrir-skref upplýsingar um MIG IP og tdample hönnunarkynslóðin.
- Áður en þú keyrir afkastahermun MIG 7 seríunnar skaltu gera eftirfarandi til að ganga úr skugga um að hermunarumhverfið þitt sé í lagi.
- Opnaðu MIG examphannaðu og kortaðu viðeigandi bókasöfn, keyrðu uppgerðina og tryggðu að þú getir séð skilaboðin „prófið staðist“ í afritinu.
- Til að sýna fram á ferlið hef ég búið til MIG IP fyrir xc7vx690tffg1761-2 og kallað á ex.amphönnun.
- Tvennt sem ætti að hafa í huga eru minnisfangabitar og val á kortlagningu minnisfanga.
- Til dæmisampÉg hef valið MT41J128M8XX-125 í fellivalmyndinni fyrir minnishluta.
Fyrir valinn minnishluta úr mynd-1, röð = 14, dálkur = 10 og banki = 3, þannig að app_addr_width = röð + dálkur + banki + röð = 28
Þú getur valið annað hvort BANK_ROW_COLUMN eða ROW BANK_COLUMN.
Ég hef yfirgefið dálkinn ROW BANK, sem er sjálfgefin vistfangavörpun.
Example hönnun Eftirlíking með tilbúnum prófunarbekk
- Undir stillingum fyrir hermun, veldu QuestaSim/ModelSim Simulator og flettu að staðsetningu þýddu bókasafnanna.
- Nánari upplýsingar um að benda á uppsetningarslóð þriðja aðila tækja, velja markhermir og þýða og kortleggja bókasöfn er að finna í (UG900) Vivado Design Suite notendahandbókinni fyrir rökfræðihermun.
Hermið notendaviðmótið (smelltu á flipann „Keyra hermun“ í verkefnastjóranum) og vertu viss um að þú sjáir skilaboðin „próf samþykkt“ í afritinu.
Performance Simulation RTL breytingar
- Hægrismelltu á flipann „heimildir“, veldu „bæta við eða búa til hermunarheimildir“ og flettu að mig7_perfsim_traffic_generator.sv. file og smelltu á klára til að bæta því við.
- Hægrismelltu á flipann „Heimildir“, veldu „Bæta við eða búa til hermunarheimildir“, flettu að perfsim_stimulus.txt og smelltu á „Ljúka við að bæta því við“.
- Athugaðu fyrrvample_top instantiation í sim_tb_top.v file.
- Bættu neðangreindum RTL línum við sim_tb_top,v
- Breyttu APP_ADDR_WIDTH, APP_DATA_WIDTH, RANK_WIDTH, H og BANK_WIDTH í samræmi við val á minnishluta. Gildi er hægt að fá úr _mig.v. file.
- Gula merkta tilviksnafnið mig_7series_0_mig getur verið breytilegt eftir íhlutarnafni þínu við stofnun IP-tölu.n, Staðfestu hvort þú hafir valið annað nafn og breyttu því í samræmi við það.
- Þegar IP-talan hefur verið búin til, opnaðu _mig.v file og kanna hvort einhverjar frávik séu í nöfnum LHS-merkja og leiðrétta þær.
- app_sr_req, app_ref_req og app_zq_req ættu að vera frumstillt á 0.
- Sem fyrrvample_top.v er útskrifuð og ný fileÞegar s eru bætt við, munt þú líklega sjá „?“ við hliðina á mig_7series_0_mig.v file undir uppgerð heimilda.
- Til að kortleggja rétt file, hægrismelltu á mig_7series_0_mig.v, veldu „Bæta við heimildum“, flettu að /mig_7series_0_example.srcs/sources_1/ip/mig_7series_0/mig_7series_0/user_design/rtl og bættu við mig_7series_0_mig_sim.v file.
- Ef þú sérð "?" fyrir undirliggjandi files, bæta við öllum RTL files í möppunum „clocking“, „controller“, „ip_top“, „phy“ og „UI“.
- Þegar RTL breytingarnar eru gerðar og allar nauðsynlegar fileÞegar s eru bætt við hermunarheimildirnar þínar ætti stigveldið að vera svipað og á mynd 5.
- The fileRauðmerkt eru nýlega bætt við og „?“ er búist við á ECC-tengdum einingum þar sem ECC-valkosturinn er óvirkur í valda minnisstillingu.
Hvati File Lýsing
Hvert örvunarmynstur er 48 bitar og sniðið er lýst á myndum 6-1 til 6-4.
Kóðun heimilisfangs (heimilisfang [35:0])
Heimilisfangið er kóðað í örvuninni eins og sýnt er á mynd 7-1 til mynd 7-6. Öll heimilisfangsreitirnir þurfa að vera slegnir inn í sextándakerfisformi.
Öll heimilisfangsreitirnir eru fjórdeilanlegir á breidd til að slá inn í sextándakerfisformi. Prófunarbekkurinn sendir aðeins nauðsynlega bita heimilisfangsreits til minnisstýringarinnar. Til dæmisampÍ átta banka stillingu eru aðeins bankabitar [2:0] sendir til minnisstýringarinnar og eftirstandandi bitar eru hunsaðir. Aukabitarnir fyrir vistfangsreit eru til staðar svo þú getir slegið inn vistfangið í sextándakerfissniði. Þú verður að staðfesta að gildið sem slegið er inn samsvari breidd tiltekinnar stillingar.
- Dálkavistfang (Dálkur[11:0]) – Dálkavistfang í örvuninni er gefið upp í allt að 12 bita, en þú þarft að taka á þessu út frá dálkbreiddarbreytunni sem er stillt í hönnuninni þinni.
- Röðfang (Röð[15:0]) – Röðfang í örvuninni er gefið upp í allt að 16 bita, en þú þarft að takast á við það.
- Þetta er byggt á raðbreiddarbreytunni sem er stillt í hönnuninni þinni.
- Bankavistfang (Bank[3:0]) – Bankavistfangið í örvuninni er gefið upp í allt að fjóra bita, en þú þarft að taka á þessu út frá bankabreiddarbreytunni sem er stillt í hönnuninni þinni.
- Röðun (Rank[3:0]) – Röðun í örvuninni er gefin upp í allt að fjóra bita, en þú þarft að taka á þessu út frá röðunarbreiddarbreytunni sem er stillt í hönnuninni þinni.
- Vistfangið er sett saman út frá efsta stigs MEM_ADDR_ORDER breytunni og sent í notendaviðmótið.
Skipun Endurtaka (Command Repeat [7:0])
- Endurtekningarfjöldi skipana er fjöldi skipta sem viðkomandi skipun er endurtekin í notendaviðmótinu. Vistfang hverrar endurtekningar er aukið um 8. Hámarksfjöldi endurtekninga er 128.
- Prófunarbekkurinn kannar ekki dálkjamörk og vefur sér í kringum þau ef hámarks dálkmörkum er náð meðan á hækkun stendur.
- Skipanirnar 128 fylla upp síðuna. Fyrir öll dálkföng önnur en 0, þá endar endurtekningartalningin 128 á að fara yfir.
- Dálkmörkin snúast að upphafi dálkvistfangsins.
Strætónotkun
Notendaviðmótið reiknar út notkun strætisvagnsins, þar sem heildarfjöldi lestra og skrifa er tekið með í reikninginn, og eftirfarandi jafna er notuð:
- BL8 tekur fjórar minnisklukkulotur
- Lok_áreitis er tíminn þegar öllum skipunum er lokið.
- calib_done er tíminn þegar kvörðun er lokið.
Example Mynstur
Þessir fyrrvampfærslur eru byggðar á MEM_ADDR_ORDER stillt á BANK_ROW_COLUMN.
Eitt lesmynstur
00_0_2_000F_00A_1 – Þetta mynstur er eitt aflestrar úr 10. dálki, 15. röð og öðrum banka.
Einstakt skrifa mynstur
00_0_1_0040_010_0 – Þetta mynstur er ein skrif í 32. dálk, 128. röð og fyrsta banka.
Einn skrifa og lesa á sama heimilisfang
- 00_0_2_000F_00A_0 – Þetta mynstur er ein skrif í 10. dálk, 15. röð og annan banka.
- 00_0_2_000F_00A_1 – Þetta mynstur er ein lestur úr 10. dálki, 15. röð og öðrum banka
Margt skrifað og lesið með sama heimilisfangi
- 0A_0_0_0010_000_0 – Þetta samsvarar 10 skrifum með vistföngum sem byrja frá 0 til 80, sem sjá má í dálknum.
- 0A_0_0_0010_000_1 – Þetta samsvarar 10 lestrum með vistfangi sem byrjar frá 0 til 8,0, sem sjá má í dálknum.
Síðubrot meðan á skrifum stendur
0A_0_2_000F_3F8_0 – Þetta samsvarar 10 skrifum með dálkvistfangi sem er vafið að upphafi síðunnar eftir eina skrif.
Hermir eftir Performance Traffic Generator
Á þessum tímapunkti ertu búinn með MIG exampHönnunarhermun. Þetta gefur til kynna að uppsetning hermunarinnar sé tilbúin, þú hafir gert breytingar á RTL fyrir afkastahermun, nýja stigveldið í hermuninni sé rétt og þú hafir skilið örvunarmynstrin. Keyrðu hermunina aftur með 16 skrifum og lestum í perfsim_stimulus.txt.
- Keyrðu allt, bíddu þar til init_calib_complete merkið hefur verið staðfest og þú munt geta séð fyrirhugaðan fjölda skrifa og lestra. Hermunin mun þá stöðvast.
- Þegar þú ert beðinn um að hætta í hermuninni skaltu velja Nei og fara í afritunargluggann þar sem þú munt geta séð tölfræði um afköst.
- Ef þú velur „hætta í hermun“ verður tölfræði um afköst skrifuð á file sem heitir mig_band_width_output.txt og er staðsett í sim_1/behave möppunni.
- Exampslóð möppunnar:- /mig_7series_0_example_perf_sim\mig_7series_0_example.sim/sim_1/hegðun
Þú gætir furða hvers vegna prósenttagNotkun strætisvagnsins er aðeins 29. Endurkeyrðu hermunina með sömu IP-stillingum, en breyttu bara örvuninni. file til 256 skrifa og 256 lesna
- ff_0_0_0000_000_0
- ff_0_0_0000_000_1
Þú munt nú sjá prósentunatage eins og 85, sem gefur til kynna að DDR3 býður upp á betri nýtingu strætisvagnsins fyrir langar skriftar- og lestrarhringi.
Almennar leiðir til að bæta afköst
Þeim þáttum sem hafa áhrif á skilvirkni má skipta í tvo hluta:
- Minni tiltekið
- Stjórnandi sérstakur
Mynd 9 gefur þér yfirview þeirra hugtaka sem eru minnissértæk.
Ólíkt SRAM og Block Memories er afköst DDR2 eða DDR3 ekki bara hámarksgagnahraði.
Það fer eftir mörgum tímasetningarþáttum, þar á meðal:
- tRCD: Seinkun á röðarskipun (eða seinkun frá ras til cas).
- tCAS(CL): Seinkun á dálkavistfangi.
- tRP: Seinkun á forhleðslu raða.
- tRAS: Virkur tími raðar (virkja til að forskipta).
- tRC: Röðunarhringrásartími. tRC = tRAS + tRP
- tRAC: Seinkun á handahófskenndri aðgangsleið. tRAC = tRCD + tCAS
- Skrifseinkunn tCWLCASas.
- tZQ: Kvörðunartími ZQ.
- tRFC: Tími raðuppfærslu
- tWTR: Seinkun á skrif-til-lesningar. Síðasta skriffærsla til lestrarskipunartíma.
- tWR: Endurheimtartími skrifa. Síðasta skriffærsla að forhleðslutíma
- Tímasetning allra skráðra breyta fer eftir gerð minnis sem notað er og hraðastigi minnishlutarins.
- Nánari upplýsingar um skilgreiningar og tímasetningarforskriftir er að finna í DDR2 og DDR3 JEDEC stöðlunum eða í gagnablöðum fyrir minnistæki.
Skilvirkni fer aðallega eftir því hvernig aðgangur er að minni. Mismunandi heimilisfang mynstur gefa mismunandi skilvirkni niðurstöður.
Kostnaður við tímasetningu minnis
- Virkjunartími og forhleðslutími þegar skipt er yfir í nýja banka/raðir eða þegar skipt er um raðir innan sama banka. - Þannig fækkar þú röðunarskiptum, sem getur fjarlægt tRCD og tRP.
- Sendu samfelldar skrif- eða lesskipanir -Viðhald tCCD tímasetningar.
- Lágmarka skiptingu á skipunum milli skrifa og lesa – Endurheimtartíma eftir skrif til að skipta yfir í lesaðgang og afgreiðslutíma strætisvagns til að skipta úr lestri í skrif.
- Stilltu rétta endurnýjunarbil.
- a. DDR3 SDRAM krefst endurnýjunarlotna með meðaltali reglulegu millibili upp á tREFI.
- b. Hægt er að gefa út allt að 8 viðbótaruppfærsluskipanir fyrirfram („dregna inn“). Þetta dregur ekki úr fjölda uppfærslum, en hámarksbilið á milli tveggja samliggjandi uppfærsluskipana er takmarkað við 9 × tREFI.
- Nýttu alla bankana – Hentugur aðgangsleið er æskilegri.
- a. Röð-Bank-Dálkur: Fyrir færslu sem á sér stað yfir raðbundið vistfangsrými opnar kjarninn sjálfkrafa sömu röð í næsta banka DRAM tækisins til að halda áfram færslunni þegar komið er að lokum núverandi raðar. Þetta hentar vel fyrir forrit sem krefjast þess að stórir gagnapakkar séu sendur á raðbundnar vistfangsstaði.
- b. Banki-Röð-Dálkur: Þegar farið er yfir raðmörk verður núverandi röð lokuð og önnur röð opnuð innan sama banka. MSB er bankavistfang sem hægt er að nota til að skipta á milli mismunandi banka. Það hentar fyrir styttri, handahófskenndari færslur í eina minnisblokk í einhvern tíma og síðan stökk í aðra blokk (banka).
- Sprungalengd
- a. BL 8 er stutt fyrir DDR3 á 7 seríunni. BC4 hefur mjög lága skilvirkni, sem er minni en 50%. Þetta er vegna þess að keyrslutími BC4 er sá sami og BL8. Gögnin eru einfaldlega falin inni í íhlutnum.
- b. Í tilfellum þar sem ekki er óskað eftir að skrifa heila burst, má íhuga annað hvort gagnagrímu eða skrifa eftir lestur.
- Stilltu rétt ZQ bil (aðeins DDR3)
Stýringin sendir bæði ZQ Short (ZQCS) og ZQ Long (ZQCL) kvörðunarskipanir.- a. Fylgdu DDR3 JEDEC staðlinum
- b. Fjallað er um ZQ kvörðun í kafla 5.5 í JEDEC Spec JESD79-3 DDR3 SDRAM staðlinum.
- c. ZQ kvörðun kvarðar On-Die Termination (ODT) reglulega til að taka tillit til breytinga á VT.
- d. Rökfræðin er að finna í bank_common.v/vhd
- e. Breytan Tzqcs ákvarðar hraðann sem ZQ kvörðunarskipun er send í minnið.
- f. Það er hægt að slökkva á teljaranum og senda hann handvirkt með app_zq_req, það er svipað og að senda endurnýjun handvirkt. Sjá nánari upplýsingar í (Xilinx svari 47924).
Yfirkostnaður stjórnanda
- Reglulegar mælingar – Sjá nánari upplýsingar í (Xilinx svar 43344).
- a. Ekki breyta tímabilinu sem lesturinn er í.
- b. Sleppa reglubundnum lestrum meðan á skrifum stendur og gefa upp fjölda misheppnaðra lestra áður en raunveruleg lestur á sér stað
- Endurröðun – Sjá nánari upplýsingar í (Xilinx svari 34392). Fyrir notendaviðmótshönnun og AXI viðmótshönnun er æskilegt að hafa þetta virkt.
- a. Endurröðun er rökfræði sem lítur fram í tímann á nokkrar skipanir og breytir röð notandaskipana þannig að skipanir sem ekki eru í minni noti ekki gilda bandvídd. Afköstin tengjast einnig raunverulegu umferðarmynstri.
- b. Byggt á vistfangsmynstrinu hjálpar endurröðun til við að sleppa forhleðslu og virkjun skipana og gerir það að verkum að tRCD og tRP taka ekki upp gagnabandvíddina.
- Reyndu að fjölga bankavélum.
- a. Mest af rökfræði stýringarins er að finna í bankavélunum og þær samsvara DRAM-bönkum.
- b. Tiltekin bankavél stýrir einum DRAM banka á hverjum tíma.
- c. Úthlutun bankavéla er breytileg, þannig að það er ekki nauðsynlegt að hafa bankavél fyrir hvern raunverulegan banka.
- d. Hægt er að stilla bankavélar, en það er málamiðlun milli flatarmáls og afkasta.
- e. Leyfilegur fjöldi bankavéla er á bilinu 2-8.
- f. Sjálfgefið er að 4 bankavélar séu stilltar með RTL breytum.
- g. Til að breyta bankavélum skal hafa í huga breytuna nBANK_MACHS = 8 sem er að finna í memc_ui_top
Example fyrir 8 bankavélar – nBANK_MACHS = 8
Þú ert nú meðvitaður um þá þætti sem hafa áhrif á afköst. Ímyndaðu þér uppstreymisforrit sem gefur þér 512 gagnabæti í hverjum pakka og þú þarft að vista þau á mismunandi minnisstöðum. Þar sem 512 gagnabæti eru jöfn 64 DDR3 gagnasprengjum, keyrðu dæmið aftur.ample hönnun með áreiti file sem inniheldur 512 skrif, 512 lestur og raðskiptingu fyrir hverjar 64 skrif eða lestur:
Í lok hermunarinnar sérðu að nýting strætisvagna er 77 prósent.
Mynd 11: Frammistöðutölfræði fyrir 512 skrif og 512 lestur - Röð skipti fyrir 64 skrif eða lestur.
Þú getur nú beitt þeirri þekkingu sem þú lærðir í fyrri hlutanum til að bæta skilvirkni. Til að nýta alla bankana í stað þess að breyta röðinni skaltu breyta vistfangsmynstrinu til að breyta bankanum eins og sýnt er hér að neðan. Þetta jafngildir því að stilla ROW_BANK_Column í stillingu minnisvistfanga í MIG GUI.
Í lok hermunarinnar muntu sjá að fyrri 77 prósent rútunýting er nú 87!
Ef þú þarfnast enn meiri skilvirkni geturðu farið í stórar pakkastærðir, 1024 eða 2048 bæti, eða íhugað handvirka endurnýjun.
Athugið: Xilinx mælir ekki með því að sniðganga endurnýjun stýringa, þar sem við erum óviss um hvort þú getir uppfyllt sjálfvirka endurnýjunartíma JEDEC, sem hefur áhrif á áreiðanleika gagna. Þú getur breytt NBANNBANk_MACH frá stýringum til að sjá afköst. Þetta gæti þó haft áhrif á hönnunartímasetningu þína. Vinsamlegast vísaðu til (Xilinx svar 36505) fyrir nánari upplýsingar um nBANk_MACH.
Opna core_name_mig_sim.v file og breytið breytunum nBANK_MACHS úr 4 í 8 og keyrið hermunina aftur.
Til að gildi breytunnar taki gildi í vélbúnaði þarftu að uppfæra core_name_mig.v. fileÉg notaði sama mynstur þar sem við fengum 87% rútunýtingu (mynd 2). Með nBANK_MACHS stillt á 8 er skilvirknin nú 90%.
Einnig skal tekið fram að ½ og ¼ stýringar hafa neikvæð áhrif á skilvirkni vegna seinkunar. Til dæmisampÞar sem við getum aðeins sent skipanir á 4 CK lotu fresti, er stundum auka bólstrun þegar farið er eftir lágmarks tímasetningarforskriftum DRAM, sem getur dregið úr skilvirkni frá því sem fræðilega er. Prófaðu mismunandi stýringar til að finna þann sem hentar skilvirkniþörfum þínum. Heimildir
- Zynq-7000 AP SoC og 7 Series FPGAs MIS v2.3 [UG586]
- Xilinx MIG lausnamiðstöð http://www.xilinx.com/support/answers/34243.html
Endurskoðunarsaga
13/03/2015 – Fyrsta útgáfa..
Skjöl / auðlindir
![]() |
XILINX 63234 END FPGA dreifingaraðili [pdfNotendahandbók 63234 END FPGA dreifingaraðili, 63234, END FPGA dreifingaraðili, FPGA dreifingaraðili |