Dolar 9,3088
Euro 10,8387
Altın 529,59
BİST 1.430
Adana Adıyaman Afyon Ağrı Aksaray Amasya Ankara Antalya Ardahan Artvin Aydın Balıkesir Bartın Batman Bayburt Bilecik Bingöl Bitlis Bolu Burdur Bursa Çanakkale Çankırı Çorum Denizli Diyarbakır Düzce Edirne Elazığ Erzincan Erzurum Eskişehir Gaziantep Giresun Gümüşhane Hakkari Hatay Iğdır Isparta İstanbul İzmir K.Maraş Karabük Karaman Kars Kastamonu Kayseri Kırıkkale Kırklareli Kırşehir Kilis Kocaeli Konya Kütahya Malatya Manisa Mardin Mersin Muğla Muş Nevşehir Niğde Ordu Osmaniye Rize Sakarya Samsun Siirt Sinop Sivas Şanlıurfa Şırnak Tekirdağ Tokat Trabzon Tunceli Uşak Van Yalova Yozgat Zonguldak
İstanbul 17 °C
Çok Bulutlu

CPU algoritması, derin sinir ağlarını en iyi GPU eğitmenlerinden 15 kata kadar daha hızlı eğitiyor

16.04.2021
80
CPU algoritması, derin sinir ağlarını en iyi GPU eğitmenlerinden 15 kata kadar daha hızlı eğitiyor

Rice Üniversitesi bilgisayar bilimcileri, ticari işlemciler üzerinde çalışan ve derin sinir ağlarını grafik işlemcilere dayalı platformlardan 15 kat daha hızlı eğiten yapay zeka (AI) yazılımını gösterdiler.

Rice’s Brown Mühendislik Okulu’nda bilgisayar bilimleri profesörü yardımcı doçenti Anshumali Shrivastava, “Eğitimin maliyeti, AI’daki gerçek darboğazdır,” dedi. “Şirketler, yapay zeka iş yüklerini eğitmek ve ince ayar yapmak için haftada milyonlarca dolar harcıyor.”

Shrivastava ve Rice ve Intel’den işbirlikçileri, makine öğrenimi sistemleri konferansında 8 Nisan’da bu darboğazı gideren araştırmayı sunacaklar.

Derin sinir ağları (DNN), bazı görevlerde insanlardan daha iyi performans gösterebilen güçlü bir yapay zeka biçimidir. DNN eğitimi tipik olarak bir dizi matris çarpma işlemidir, grafik işleme birimleri (GPU’lar) için ideal bir iş yüküdür ve maliyeti genel amaçlı merkezi işlem birimlerinden (CPU’lar) yaklaşık üç kat fazladır.

Shrivastava, “Tüm endüstri tek bir iyileştirme türüne odaklanmıştır – daha hızlı matris çarpımları,” dedi. “Herkes matris çarpımını zorlamak için özel donanım ve mimarilere bakıyor. İnsanlar artık belirli derin öğrenme türleri için özel donanım-yazılım yığınlarına sahip olmaktan bahsediyorlar. Pahalı bir algoritma alıp tüm dünyayı sistem optimizasyonuna atmak yerine, “Algoritmayı tekrar gözden geçirelim” diyorum. “

Shrivastava’nın laboratuvarı bunu 2019’da yaptı ve DNN eğitimini karma tablolarla çözülebilecek bir arama sorunu olarak yeniden şekillendirdi. Onların “alt doğrusal derin öğrenme motoru” (SLIDE), ticari işlemcilerde çalışmak üzere özel olarak tasarlandı ve Shrivastava ve Intel’den işbirlikçileri, MLSys 2020’de açıkladıklarında GPU tabanlı eğitimden daha iyi performans gösterebileceğini gösterdi.

Çalışma bu hafta MLSys 2021’de sunacaklar SLIDE’nin performansının modern CPU’larda vektörleştirme ve bellek optimizasyon hızlandırıcıları ile iyileştirilip iyileştirilemeyeceğini araştırdı.

Rice yüksek lisans öğrencisi olan çalışmanın ortak yazarı Shabnam Daghaghi, “Hash tablosu tabanlı hızlandırma zaten GPU’dan daha iyi performans gösteriyor, ancak CPU’lar da gelişiyor” dedi. “SLIDE’ı daha da ileri götürmek için bu yeniliklerden yararlandık ve matris çarpımlarına sabitlenmemişseniz, modern CPU’ların gücünden yararlanabileceğinizi ve AI modellerini en iyi özelleştirilmiş donanım alternatifinden dört ila 15 kat daha hızlı eğitebileceğinizi gösterdik.”

Rice lisans öğrencisi olan ortak yazar Nicholas Meisburger, “CPU’lar hala hesaplamadaki en yaygın donanımdır. Bunları yapay zeka iş yükleri için daha çekici hale getirmenin faydaları küçümsenemez.” Dedi.


ZİYARETÇİ YORUMLARI - 0 YORUM

Henüz yorum yapılmamış.