Verzicht fällt schwer
Filmaufnahmen, selbst solche im immer öfter unterstützten 4K-Format, benötigen viel weniger Bildpixel als die Sensoren aktueller Kameras liefern können. Es sollte also einfach sein, mit den vor allem für Standbilder entwickelten Sensoren auch die Daten für Videobilder auszulesen, aber das ist es keineswegs.
Digitalkameras haben heutzutage durchweg Sensoren, die zwischen 12 und 50 Megapixel auflösen. Full-HD-Video benötigt knapp 2 Megapixel und 4K-Video in der Consumer-Variante UHD 8,3 Megapixel; selbst in der professionellen Variante Cinema 4K sind es nur knapp 9 Megapixel. Beim Vergleich zwischen Stand- und Bewegtbild müssen wir aber auch berücksichtigen, dass Video eine hohe Bildfrequenz erfordert: Im Serienbildmodus sind 10 Bilder/s schon ein recht guter Wert, während 4K-Video wenigstens 24 Bilder/s erfordert. Der geringeren Auflösung steht eine höhere Bildfrequenz gegenüber und beides sollte sich annähernd ausgleichen, so dass Standbild- und Videomodus ähnliche Anforderungen stellen. Jedenfalls dann, wenn die Auslesegeschwindigkeit des Sensors steigt, je weniger Pixel am Ende benötigt werden. Aber stimmt das überhaupt?
Man könnte denken, dass es ganz einfach wäre: Wenn beispielsweise nur jedes vierte Pixel benötigt wird, liest man nur jedes vierte Pixel aus. Manche Hersteller haben es genau so gemacht, aber das Ergebnis waren Videos, die durch Farbmoiré entstellt wurden, wann immer feine regelmäßige Strukturen im Bildfeld erschienen. Liest man nämlich nur einen Teil der Sensorpixel aus, sind die so ausgelesenen Werte nicht repräsentativ für den größeren Bereich, für den sie stehen. Wenn es an dieser Stelle feine, aber kontrastreiche Strukturen gibt, ist es reiner Zufall, ob das eine Sensorpixel, das ausgelesen wird, nun einen helleren oder dunkleren Bildpunkt erfasst. Es ist ein wenig so, als wollte man die politischen Neigungen in den deutschen Bundesländern herausfinden und würde in jedem Bundesland nur einen einzigen, zufällig ausgewählten Bürger nach seinen politischen Präferenzen befragen, obwohl doch schon dessen Nachbar anders denken könnte.
Dem ließe sich leicht abhelfen, wenn man auch für Videobilder stets den gesamten Sensor auslesen, aus den rot-, grün- oder blauempfindlichen Sensorpixeln ein RGB-Bild berechnen und dieses auf die benötigte Pixelzahl herunterskalieren würde. Für die Bildqualität würde das Wunder wirken, aber bei Sensoren mit 24 Megapixeln und mehr funktioniert das leider nicht – die derzeit verfügbaren Sensoren erlauben keine so hohe Ausleseraten, und selbst wenn es anders wäre, würde sich der Chip zu stark aufheizen.
Eine Lösung dieses Problems besteht im Pixel-Binning, also der Zusammenfassung von Pixeldaten schon während des Auslesens. Aus vier mal vier Sensorpixeln kann man je vier rot-, grün- und blauempfindliche Pixel zusammenfassen, so dass man am Ende vier Pixel erhält – je ein rot- und blauempfindliches und zwei grünempfindliche Pixel, so wie sie das Bayer-Muster vorsieht. Das Ergebnis sind Sensordaten mit einem Viertel der ursprünglichen Auflösung, die sich auf die übliche Weise weiter verarbeiten lassen.
Die dritte Variante besteht darin, sich auf einen Ausschnitt zu beschränken. Die Kamera nutzt dann nur den mittleren Teil des Sensors, davon aber alle Pixel. Bei Kameras mit Kleinbild oder Mittelformatsensor wie der Leica S (Typ 007) oder der Sony Alpha 7R II entspricht der Ausschnitt dem „Super 35“ Format. „Super 35“ verweist auf die Ursprünge der Kleinbildfotografie: Der Kleinbildfilm war eigentlich der 35-mm-Kinofilm – die nur für Filmkameras und -Projektoren nötigen Perforationslöcher erinnern noch daran. Der Kinofilm wurde vertikal durch die Kamera transportiert und seine Breite gab daher die Bildbreite von 24 mm vor; die Bildhöhe war 18 mm. Frühe Kleinbildkameras wie die erste Leica drehten den Filmtransport um 90 Grad – aus der Breite von 24 mm wurde die Höhe, woraus das Kleinbildformat von 24 mal 36 mm entstand. Das Format mit einer Breite von 24 mm und einer bei einem Seitenverhältnis von 16:9 sich daraus ergebenden Höhe von 13,5 mm feiert nun in der Digitalfotografie fröhliche Urständ’ und wird wie das analoge Filmformat als „Super 35“ bezeichnet.
Panasonics GH4 beispielsweise hat einen 16-Megapixel-Sensor, der vollständig ausgelesen werden kann, um die Bilddaten dann auf eine 4K-Auflösung herunterzurechnen. Die Sony Alpha 7R II mit ihren 42 Megapixeln bietet die Wahl zwischen der Nutzung des vollen Sensorformats und einem dem Super-35-Format entsprechenden Ausschnitt. Das volle Sensorformat kann nicht mit vollständiger Auflösung ausgelesen werden; das gibt die Sensortechnologie noch nicht her. Es bleibt also nur ein Pixel-Binning, das für die gleiche Farbe empfindliche Sensorpixel zusammenfasst. Ein UHD-Bild benötigt 3840 mal 2160 Pixel und die ideale Ausgangsgröße für das Binning wäre die jeweils verdoppelte Breite, also 7680 Pixel. Für ein Seitenverhältnis von 3:2 wären dann 5120 Pixel in der Höhe nötig, woraus sich 39 Megapixel ergeben. Nun wären 39 Euro ein guter Preis, weil er deutlich unter 40 Euro zu liegen scheint, aber bei Megapixeln will man den tatsächlichen Wert größer erscheinen lassen – es sollte also eine „4“ vorne stehen. Und was folgt hinter der „4“? Seit Douglas Adams’ „Per Anhalter durch die Galaxis“-Trilogie wissen wir, dass die Antwort auf das Leben, das Universum und den ganzen Rest 42 lautet, und warum nicht auch als Auflösung eines Sensors. Die Bilder würden dann 7952 mal 5304 Pixel messen, was in der Breite lediglich 3,4 Prozent mehr als das Doppelte der UHD-Auflösung ist. Ohne einen nennenswerten Verlust beim Bildwinkel kann die Kamera durch Pixel-Binning ein 4K-Bild berechnen und dabei Standbilder erzeugen, deren Auflösung deutlich über den 36 Megapixeln der Spitzenmodelle von Nikon liegt und nicht so weit von den 50 Megapixeln der Canon EOS 5DS entfernt ist.
Im Super-35-Modus hingegen fallen bei der Alpha 7R II nur etwa 15 Megapixel an, die die Kamera vollständig auslesen und die der Prozessor auf die geforderten gut 8 Megapixel umrechnen kann. Damit wäre erklärt, warum Sonys höchstauflösendes Modell exakt 42 Megapixel auflöst – genug, um Nikon zu übertreffen und um das ideale Ausgangsmaterial für 4K-Video zu liefern, aber genug auch, um eine reelle Chance gegen die Canon EOS 5DS (R) zu haben.