Builder.cz - Informacni server o programovani

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Uzitecnost/rychlost XMM

Seznam témat     Nová odpověď

Přihlásit se     Registrace     Zapomenuté heslo

Re: Uzitecnost/rychlost XMM

Autor: AnonymousUser

3:38:36 10.10.2009

Tohle může být zajímavá debata, nicméně zde odmítám odpovídat. Jednodušší by bylo zduplikovat to do asm.

Ale řeknu tohle, cokoli se dá uchopit špatně i dobře. A pro xmm to hodně platí.

A pak posuzovat vše podle dnešního stavu, to je poněkud nepraktické.

Řada lidí uchopuje SIMD instrukce špatně. Jsou nadšení z vektorových instrukcí a nezvládají je používat efektivně.

Mimochodem, před časem jsem napsal, že na SIMD neuděláte srovnatelně rychlý výpočet třeba sinu jako na FPU. Spousta lidí se směje, dokazuje testy, ale vlastně ani neví co testují. Výpočet sinu na 6 desetinných míst je sranda, ale výpočet sinu na 20 platných číslic jako to dělá FPU je jiné kafe. A to ještě nikdo nad SIMD nepředvedl.

Citovat příspěvek

 

Re: Uzitecnost/rychlost XMM

Autor: Maaartin

21:05:08 04.10.2009

MOHL BY PLS NAKY ADMIN PRESUNOUT MUJ DOTAZ KAM PATRI (ASM)?

Citovat příspěvek

 

Uzitecnost/rychlost XMM

Autor: Maaartin

17:35:14 04.10.2009

Dival jsem se jak kryptograficky algoritmy pouzivaji XMM a zarazi me ze casto ziskaji i za cenu silenyho programovani oproti pouziti normalnich registru jen par procent rychlosti - a to plati i pro novy algoritmy. Zajima me proc to tak je, takze par dotazu:

Mam pravdu ze athlon umi 3 normalni instrukce paralelne ale jen 2 co pracuji s XMM registry? Jak je to u intelu?

Latence normalnich instrukci (ADD, XOR) je 1 cyklus zatimco latence odpovidajich instrukci pro XMM je 2 cykly? Nekde jsem to takhle cetl (asi amd) ale plati to jeste? A i pro intel?

U XMM chybi pro tohle pouziti aspon dve dulezity veci: rotace a 3-operandovy instrukce. Ty sice teoreticky existuji (SSE5, AVX) ale nikde jsem se nedocetl ktery procaky to umi.

Citovat příspěvek

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: