1 Entwurf eines einfachen Frameworks
Vulkan [1], [2], [3] bietet nie dagewesene Möglichkeiten und Freiheiten zum Preis einer im Vergleich zu OpenGL deutlich komplizierteren Handhabe. In Anbetracht dieser Tatsache dürfte es daher auch niemanden verwundern, dass die praktische Arbeit mit einem Low-Level-API wie Vulkan ohne Zuhilfenahme eines geeigneten Frameworks schnell zu einem mühevollen Unterfangen wird. Es gibt jedoch noch einen weiteren Grund, warum wir uns so früh wie möglich mit dem Entwurf eines eigenen Frameworks befassen sollten: In der Entwurfsphase können wir uns mit sämtlichen Aspekten des neuen Vulkan-API vertraut machen, ohne dass wir uns gleich in alle Details der zugrunde liegenden Programmabläufe einarbeiten müssen.
Im ersten Teil dieser shortcut-Reihe haben wir uns mit den Voraussetzungen befasst, unter denen die neue Vulkan-Schnittstelle ihre Vorteile gegenüber dem mittlerweile etwas in die Jahre gekommenen OpenGL-API voll ausspielen kann. Vorbei sind die Zeiten, in denen bei der Entwicklung einer Grafikanwendung sämtliche mit OpenGL in Verbindung stehende Programmabläufe innerhalb eines einzigen Threads implementiert werden mussten. Rendering-Operationen, Buffer- und Ressourcenupdates (Austausch der nicht mehr benötigten Texturen und 3-D-Modelle) sowie die mitunter erforderlichen Compute-Shader-basierten Berechnungen lassen sich im Verlauf der Vulkan-Programmentwicklung im Prinzip auf eine beliebig große Anzahl von Threads aufteilen. Damit die einzelnen Threads jedoch auch wirklich parallel zueinander ausgeführt werden können, muss man als Entwickler dafür Sorge tragen, dass sich die Anzahl der Threads an die jeweils zur Verfügung stehende Hardware anpassen lässt.
Doch auch an dieser Stelle ist Vorsicht geboten: In der Theorie ist es zwar korrekt, dass beispielsweise auf einer 8-Kern-CPU acht Threads parallel ausgeführt werden können, allerdings sollte man stets in Erinnerung behalten, dass sowohl das Betriebssystem als auch weitere Anwendungen ein gewisses Maß an Rechenzeit für sich selbst in Anspruch nehmen. Darüber hinaus ist es zwingend erforderlich, eine mehr oder weniger große Zahl von Threads für Programmabläufe zu reservieren, die zwar nichts mit der eigentlichen grafischen Darstellung zu tun haben, für deren Ausführung jedoch innerhalb des Hauptprogrammthreads schlicht zu wenig Zeit zur Verfügung steht. Hierzu zählen unter anderem KI-Berechnungen, Physiksimulationen, Kollisionsberechnungen, mögliche Interaktionen mit der Spielewelt, die Musik-, Sound- und Sprachausgabe oder die prozedurale Generierung der Spielewelt.
Das Vulkan-API bietet uns darüber hinaus auch die Möglichkeit, die Kommunikation zwischen der CPU und der GPU (der Grafikkarte) an die jeweiligen Anforderungen einer Grafikanwendung anzupassen. Im einfachsten Fall erfolgt die komplette Kommunikation (Rendering-Operationen, Buffer- und Ressourcenupdates sowie Compute-Shader-basierte Berechnungen) über ein einziges VkQueue-Objekt. Das hat jedoch den offenkundigen Nachteil, dass sich die anstehenden Arbeitsanweisungen nur sequenziell an die Grafikkarte übermitteln lassen. Nichtsdestotrotz sollte diese Variante in allen Vulkan-Anwendungen standardmäßig implementiert werden, weil sich hierdurch die Kompatibilität mit sämtlichen Vulkan-fähigen Grafikkarten gewährleisten lässt. Hinweis: Nvidia-Karten unterstützen beispielsweise im Gegensatz zu ihren AMD-Pendants die parallele Verwendung von mehreren Grafik- bzw. Rendering-Queues. Die Verwendung von drei unterschiedlichen Queue-Objekten stellt indes den bestmöglichen Kompromiss zwischen Performance (gleichbleibend hohe Frameraten) auf der einen und Kompatibilität auf der anderen Seite dar. Hierbei ist Queue Nr. 1 für die Durchführung der Rendering-Operationen, Queue Nr. 2 für die Buffer- und Ressourcenupdates und Queue Nr. 3 für die Ausführung der Compute-Shader-basierten Berechnungen zuständig.
Was das Vulkan-API betrifft, so zeichnet es sich leider nicht durch besondere Einsteigerfreundlichkeit aus, was nicht zuletzt an der Vielzahl der unterschiedlichen Datentypen (Strukturen und Enums) liegt, die bei praktisch allen Funktionsaufrufen als Parameter zu berücksichtigen sind. Erschwerend kommt hinzu, dass man sich im Unterschied zu OpenGL bzw. zu früheren DirectX-Versionen nun auch um die Synchronisierung sämtlicher Programmabläufe – z. B. um die korrekte Abfolge der Compute-Shader-basierten Berechnungen und Rendering-Schritte – sowie um das komplette Speichermanagement zu kümmern hat. Dazu gehören etwa das Anfordern, Aufteilen und wieder Freigeben von Speicherplatz, das Festlegen des jeweiligen Speicherverwendungszwecks und das Durchführen des Datentransfers zwischen CPU- und GPU-Speicher mithilfe von temporär erzeugten Staging-Buffer-Objekten. Aufgrund der großen Zahl der damit einhergehenden API-Funktionsaufrufe tendiert der Sourcecode daher auch bei vermeintlich einfachen Anwendungen und Demoprogrammen dazu, mit fortschreitender Entwicklungsdauer zunehmend unübersichtlich zu werden. Selbst als Vulkan-Novize überlegt man daher bereits nach relativ kurzer Zeit, wie sich die ganzen Vulkan-API-Calls hinter möglichst wenigen unkomplizierten Funktionen und Klassenmethoden verbergen lassen.
Handhabung der grundlegenden Funktionsabläufe einer Vulkan-Anwendung
Der erste Schritt bei der Entwicklung des in unseren Programmbeispielen zum Einsatz kommenden Frameworks bestand zunächst im Entwurf der CBaseVulkanApp-Klasse, in deren Verantwortungsbereich die Handhabung von sämtlichen elementaren, mit dem Vulkan-API in Verbindung stehenden Funktionsabläufen liegt. Im Rahmen der Programminitialisierung kommen zunächst einmal die beiden nachfolgend gezeigten Klassenmethoden zum Einsatz:
- Init_ApplicationWindow()
- Init_Vulkan()
Während sich mithilfe der ersten Methode die Fenster- bzw. Vollbildeigenschaften der Anwendung festlegen lassen, ist die zweite Methode für die Initialisierung der eigentlichen Vulkan-Instanz verantwortlich. Soll eine laufende Anwendung schließlich wieder beendet werden, ist für die Durchführung der anstehenden Aufräumarbeiten ein Aufruf der CleanUp()-Methode erforderlich.
Die vielfältigen Shader-Programme, die für die Animation, Beleuchtung und Darstellung der virtuellen (Spiele-)Welten verantwortlich sind, können als Herzstück einer jeden Grafikanwendung gesehen werden. Im Unterschied zu OpenGL müssen diese Programme unter Vulkan jedoch zunächst kompiliert und im SPIR-(Standard-Portable-Intermediate-Representation-)V-Format abgespeichert werden. Zum Laden eines zuvor kompilierten Shader-Programms können wir dann in Abhängigkeit vom jeweiligen Shader-Typ auf eine der nachfolgenden CBaseVulkanApp-Klassenmethoden zurückgreifen:
- Load_VertexShader_SPV_File()
- Load_FragmentShader_SPV_File()
- Load_ComputeShader_SPV_File()
Bevor wir nun auf die weiteren Aufgaben der CBaseVulkanApp-Klasse zu sprechen kommen, sollten wir uns zuvor noch einmal die Funktionsweise des Vulkan-APIs in Erinnerung rufen. Sämtliche Arbeitsanweisungen, die für die Durchführung der Rendering-Operationen, Shader-basierten Berechnungen und Ressourcenupdates erforderlich sind, werden in so genannten VkCommandBuffer-Objekten zwischengespeichert und unter Verwendung eines oder mehrerer VkQueue-Objekte an die Grafikkarte (GPU) weitergeleitet. In Abhängigkeit von ihrem jeweiligen Verwendungszweck können wir bei der Initialisierung der hierfür benötigten Buffer auf eine der drei nachfolgend gezeigten CBaseVulkanApp-Methoden zurückgreifen:
- Create_GraphicsCommandBuffer()
- Create_DataTransferCommandBuffer()
- Create_ComputeCommandBuffer()
Sind die Arbeitsanweisungen erst einmal in einem Command Buffer gespeichert, lässt sich dieser mithilfe einer der nachfolgend aufgeführten Klassenmethoden beliebig oft an die Grafikkarte weiterleiten. Welche Methode in diesem Zusammenhang zu verwenden ist, hängt von der Art der zu übermittelnden Anweisungen ab:
- Submit_CommandBufferToGraphicsQueue()
- EndAndSubmit_CommandBufferToGraphicsQueue()
- Submit_CommandBufferToDataTransferQueue()
- EndAndSubmit_CommandBufferToDataTransferQueue()
- Submit_CommandBufferToComputeQueue()
- EndAndSubmit_CommandBufferToComputeQueue()
- Submit_RenderingStepCommandBuffer_To_GraphicsQueue()
Für die Übermittlung der für die Szenendarstellung zuständigen Command-Buffer-Objekte müssen wir auf die Submit_RenderingStepCommandBuffer_To_GraphicsQueue()-Methode zurückgreifen. Damit es im Verlauf des Renderings zu keinerlei Darstellungsfehlern kommt, gilt es, mithilfe der nachfolgend gezeigten Klassenmethoden sicherzustellen, dass die einzelnen Rendering-Schritte auch wirklich in der von uns vorgesehenen Reihenfolge ausgeführt...