Google, yapay zeka altyapısında ihtilal niteliğinde bir adım atarak yeni jenerasyon özel TPU (Tensor Süreç Birimi) mimarisini duyurdu. Şirketin yedinci kuşak TPU’su olan Ironwood, bilhassa Gemini modellerinin gelişmiş gereksinimlerine karşılık vermek için tasarlandı. Google, bu işlemcinin simüle edilmiş akıl yürütme üzere ileri düzey misyonları mümkün kıldığını belirtiyor. Teknoloji devi bu periyodu “çıkarım çağı” (age of inference) olarak isimlendiriyor.
Google, yeni kuşak Gemini modellerinden bahsederken sırf model mimarisinden değil, bu modellerin performansını mümkün kılan altyapıdan da kelam ediyor. Bu altyapının merkezinde ise artık Ironwood yer alıyor. Şirket, bu işlemciyle birlikte “ajan benzeri” yapay zeka sistemlerinin güç kazanacağını tabir ediyor. Bu tıp sistemler, kullanıcı ismine bilgi toplayabilen, karar alabilen ve çıktılar üretebilen yapılar olarak tanımlanıyor. Velhasıl Google, yapay zekanın yalnızca yanıtlayan değil, proaktif formda harekete geçen bir yapıya evrildiğini duyuruyor.
Donanımsal güç gösterisi
Ironwood, şimdiye kadarki en güçlü ve ölçeklenebilir TPU olarak tanıtıldı. Her bir çip saniyede 4.614 TFLOPs’a kadar çıkarım (inference) süreç kapasitesine sahip. Bu çipler, Google’ın geliştirdiği yeni kuşak Inter-Chip Interconnect (ICI) üzerinden direkt birbiriyle irtibat kurabiliyor. Üstelik bu işlemciler, sıvı soğutmalı yapılarıyla 9.216 adete kadar kümelenerek çalışabiliyor. Bu dev yapı, toplamda 42,5 Exaflops’luk hesaplama gücüne ulaşabiliyor. Google, Ironwood’un sadece kendi projelerinde değil, bulut tabanlı yapay zeka projeleri geliştiren yazılımcılar için de büyük avantaj sağlayacağını söylüyor. Geliştiriciler, bu yeni jenerasyon işlemcileri iki farklı yapılandırmada kullanabilecek: 256 çiplik sunucular ya da tam kapasiteyle çalışan 9.216 çiplik dev kümeler. Ironwood çipleri sırf süreç gücüyle değil, bellek kapasitesiyle de dikkat çekiyor. Her bir TPU, 192 GB bellekle donatılmış. Bu, bir evvelki jenerasyon olan Trillium (TPU v6) ile karşılaştırıldığında 6 katlık bir artış manasına geliyor. Bellek bant genişliği de 7,2 Tbps ile 4,5 kat uygunlaştırılmış durumda. Ek olarak firma, Ironwood’un watt başına performans açısından Trillium’a kıyasla iki kat daha verimli olduğunu vurguluyor.
Hatta Google, Ironwood’a o kadar güveniyor ki kimi tartışmalı kıyaslamalar bile yapmaktan geri durmuyor. Şirket, Ironwood’un dünyanın en güçlü muhteşem bilgisayarı olarak bilinen El Capitan’ın emsal sistem segmentlerinden 24 kat süratli olduğunu argüman ediyor. Google bu kıyaslamayı FP8 üzerinden yapıyor lakin 1,7 Exaflops sunan El Capitan’da bu takviye yok.
Google’ın Ironwood’u son periyottaki bir trendin sürat kesmeden devam edeceğini de gösteriyor: Nvidia’dan bağımsızlaşmak. Nvidia, kesimde hala tartışmasız monopol olsa da Amazon’un Trainium, Inferentia ve Graviton çipleri; Microsoft’un Maia 100 üzere tahlilleri ve son olarak Ironwood, teknoloji devlerinin şirket içi tahlillere büyük ehemmiyet verdiğini gösteriyor.