Τα metadata είναι η συλλογή πληροφοριών που περιγράφουν το περιεχόμενο, την ποιότητα, τη μορφή και άλλα χαρακτηριστικά ενός βίντεο. Ουσιαστικά, είναι το “ποιος, τι, πότε, πού και πώς” ενός αρχείου βίντεο. Αυτές οι πληροφορίες βοηθούν τα συστήματα διαχείρισης βίντεο και τις μηχανές αναζήτησης να οργανώσουν και να προσαρμόσουν το βίντεο σας.
Δεδομένου ότι οι περισσότερες καταναλωτικές συσκευές προβολής (τηλεοράσεις, προβολείς) δεν μπορούν να καλύψουν τις προδιαγραφές που προβλέπει η SMPTE( Society of Motion Picture and Television Engineers) για την αναπαραγωγή υλικού HDR (π.χ χρωματικό τρίγωνο, φωτεινότητα, gamma), αποφασίστηκε η χρήση των metadata.
Τα metadata διακρίνονται σε 2 κατηγορίες. Τα στατικά (static) και τα δυναμικά (dynamic).
Τα static metadata περιλαμβάνουν συγκεκριμένες πληροφορίες που αφορούν το master monitor που χρησιμοποιήθηκε κατά το mastering του hdr υλικού. Τα static metadata ορίζουν την αντιστοίχηση τόνου για ολόκληρο το πρόγραμμα, χωρίς αλλαγές σκηνής.
Βάσει αυτών των πληροφοριών τα καταναλωτικά προβολικά (τηλεοράσεις, προβολείς) προσαρμόζουν το στατικό tone mapping τους, προσπαθώντας να εξομοιώσουν με αυτό του master monitor.
Πιο συγκεκριμένα οι πληροφορίες που συναντάμε στα static metadata κατά st.2086 είναι οι ακόλουθες:
MaxCLL – ( Maximum Content Light Level) – Το MaxCLL είναι η πληροφορία που ανταποκρίνεται στην τιμή του φωτεινότερου εικονοστοιχείου (pixel) στο περιεχόμενο και ως μονάδα μέτρησης ορίζονται τα nits.
Max FALL – ( Maximum Frame–Average Light Level) Το Max FALL καθορίζει το μέγιστο μέσο επίπεδο φωτεινότητας, σε nits, για οποιοδήποτε μεμονωμένο “καρέ” εντός μιας κωδικοποιημένης ροής βίντεο HDR.
Το Max Fall υπολογίζεται βγάζοντας τη μέση τιμή των αποκωδικοποιημένων τιμών φωτεινότητας όλων των εικονοστοιχείων σε κάθε καρέ.
Το πρόβλημα με τα «static metadata» είναι ότι εάν η χαρτογράφηση τόνων εκτελείται χωρίς πληροφορίες περιεχομένου, σκηνής ανά σκηνή, η χαρτογράφηση θα βασίζεται μόνο στη φωτεινότερη σκηνή και στη μεγαλύτερη τιμή της σε ολόκληρο το περιεχόμενο.
Ως αποτέλεσμα, ένα μεγάλο μέρος του περιεχομένου θα έχει μεγαλύτερη συμπίεση δυναμικής περιοχής και γκάμα χρωμάτων (color gamut) από ό,τι θα έπρεπε πραγματικά. Έτσι, όσο λιγότερο είναι η απόδοση της οθόνη (φωτεινότητα σε σχέση με αυτή του master monitor) σε περιεχόμενο HDR, τόσο πιο σημαντικό είναι ότι το περιεχόμενο (content) είναι σωστά χαρτογραφημένο.
Αυτό μας φέρνει στα «Dynamic metadata», τα οποία περιλαμβάνουν περισσότερες πληροφορίες για να βοηθήσουν τις λιγότερο ικανές οθόνες να χαρτογραφούν σωστά το περιεχόμενο.
Καθώς οι τηλεοράσεις προσφέρουν πλέον κορυφαία φωτεινότητα (luma) κοντά στις οθόνες βαθμολόγησης, υπάρχει όλο και λιγότερη ανάγκη για Dynamic metadata.
Ωστόσο, αυτό δεν ξεπερνά το πρόβλημα των διαφορετικών οθονών που χρησιμοποιούν διαφορετική αντιστοίχηση τόνου η τα ζητήματα της βαθμονόμησης HDR της οικιακής τηλεόρασης, η οποία ουσιαστικά δεν υπάρχει.
Το HDR10+ προσφέρει επίσης Dynamic metadata, που ταιριάζουν ουσιαστικά με το Dolby Vision, αλλά χωρίς καμία σχετική χρέωση άδειας χρήσης για τους κατασκευαστέςοθονών.
Εάν αναφερθούμε στους προβολείς χρησιμοποιούν έναν «πολλαπλασιαστή», προσποιούμενος ουσιαστικά ότι το μέγιστο luma είναι 1080 nits, όχι 108 nits.
Αυτό λειτουργεί καθώς η αντίληψη της φωτεινότητας αλλάζει ανάλογα με το μέγεθος της οθόνης.
Ελπίζω να σας δώσαμε με κατανοητό τρόπο το τι είναι metadata (στατικά η δυναμικά).