Ne détruisez pas les archives!
Bien connu de la communauté des spécialistes en mastering et des ingénieurs du son depuis sa publication originale le 14 décembre 1992, cet article est paru sur plusieurs sites Web pour disparaître à maintes reprises au fil des ans. La famille de Michael Gerzon a bien voulu nous accorder la permission de le publier ici dans son intégralité pour le rendre accessible au plus grand nombre possible de lecteurs.
Préface
Il y a déjà plusieurs années, Michael Gerzon nous montrait comment certains des problèmes liés aux technologies analogiques pourraient être corrigés, voire éliminés avec les progrès technologiques à venir. J’ai relu ce texte récemment afin de prendre la mesure des changements qui sont survenus en matière d’archivage et d’en réévaluer la pertinence, 35 ans plus tard. Des pratiques d’archivage discutables et certaines attitudes assez répandues dans le milieu de l’archivage à l’égard de la technologie, qui ne sont pas sans rappeler l’état d’esprit des années 1970, sont à l’origine de ma relecture.
Mais tout d’abord, replaçons les choses dans leur contexte. Au moment où les technologies audionumériques faisaient leur apparition et que presque tous proclamaient la « perfection du support numérique », Michael Gerzon disait à qui voulait l’entendre : « ne détruisez pas les archives! »
Pour ceux qui ne le connaissent pas, le texte est un peu comme les « Prophéties » de Nostradamus du monde de l’archivage audio, où l’auteur y va de ses prédictions au sujet des développements futurs qui permettront d’extraire de l’information supplémentaire d’une source analogique et où il nous dit que les sources ne devraient jamais être détruites.
Ce n’est pas tant parce qu’il semble nous enjoindre de conserver soigneusement nos enregistrements originaux analogiques que le texte est important. Les propos de Gerzon au sujet de l’utilisation des technologies futures pour corriger les défectuosités techniques et la détérioration des supports analogiques étaient à la fois visionnaires et prophétiques.
Les technologies à taux d’échantillonnage élevé offrent un bon exemple de ces nouvelles capacités technologiques, qui permettent notamment de corriger les irrégularités causées par le pleurage et le scintillement, et même par la déformation du ruban. Il est maintenant possible d’utiliser le signal de polarisation d’un enregistrement comme source de réajustement de la vitesse, ce qui permet, à l’aide d’algorithmes complexes, de corriger les imperfections temporelles causées par l’état du ruban ou le pleurage et le scintillement. Ces technologies ont été commercialisées et sont aujourd’hui employées pour effectuer ces tâches ou récupérer les métadonnées à partir du signal de polarisation et les conserver en mémoire pour leur utilisation future.
Le lecteur audio magnéto-optique de pouce doté d’une tête de lecture à 32 canaux et d’un processeur numérique à haute vitesse est un autre exemple des plus récents développements technologiques. Cet appareil peut détecter automatiquement le nombre de pistes audio, effectuer des réglages précis d’azimut en temps réel et filtrer les effets de diaphonie entre les voies et l’effacement partiel des pistes. Cet appareil est utilisé pour l’« Usine de Sauvegarde » du projet européen Presto-Space.
Il est difficile de prédire comment les nouvelles technologies pourront nous aider dans le domaine de l’archivage. Mais ce que je peux affirmer maintenant, c’est que la technologie change plus rapidement que jamais et que nos enregistrements analogiques continuent de susciter beaucoup d’intérêt. Pour les intervenants du milieu de l’archivage et ceux dont les décisions auront des conséquences sur notre patrimoine analogique, cet article est non seulement une lecture obligatoire, mais un mantra qui peut guider ceux qui doivent prendre des décisions d’ordre technique autant que financier.
Michael Gerzon était un mathématicien prodigieux, un ingénieur du son et un inventeur, mais surtout un visionnaire authentique.
Résumé
Ce texte fait valoir l’importance de ne pas détruire les enregistrements originaux une fois qu’ils ont été transférés sur support numérique. Nous verrons que les matrices des enregistrements originaux, sur disque aussi bien que sur bande analogique, contiennent de l’information indispensable que la technologie actuelle est incapable de récupérer, mais qui pourrait l’être par une nouvelle technologie de restauration de la qualité des enregistrements. Aussi, en détruisant ces enregistrements, c’est la possibilité même de ces améliorations qui est à jamais perdue.
1. Introduction
1.1 Le problème
Ce texte est motivé par les nouvelles alarmantes provenant de sources variées selon lesquelles les matrices originales d’enregistrements, sur disque ou sur bande analogique, sont détruites après avoir été transférées sur un support numérique moderne. Cet article s’efforcera de montrer que les enregistrements originaux contiennent de l’information que les moyens technologiques actuels ne permettent pas de récupérer, mais qui pourra être utile lorsque de nouvelles technologies plus puissantes seront mises au point pour la récupération, le stockage et le traitement de signal. Le processus de transfert numérique lui-même sacrifie plus de 99 % de cette information, ce qui la rend inaccessible pour les futures technologies. La conclusion qu’il faut tirer : ne jetez jamais un enregistrement original, peu importe sa qualité.
1.2 La destruction des enregistrements originaux : les raisons
Les raisons qui expliquent la destruction des enregistrements originaux sont de deux ordres. Premièrement, la conservation des matrices engendre des coûts élevés en terme d’espace de rangement, de main-d'œuvre et de maintien des conditions optimales d’entreposage (température, humidité, etc.). Deuxièmement, il existe une croyance fort répandue — cet article démontrera qu’elle n’est pas fondée — que la technologie moderne de transfert numérique est pratiquement parfaite, ce qui amène les gens à croire que la qualité d’une copie numérisée équivaut à celle de la matrice originale.
Comme nous le verrons, il y a tout lieu de croire que les futures technologies permettront de restaurer la sonorité des enregistrements originaux de manière plus précise et fidèle que le font actuellement les technologies de transfert. Nous analyserons plus en détail l’information que contiennent les enregistrements originaux et les façons dont elle peut être utilisée à l’avenir.
1.3 Un avertissement inquiétant
L’idée selon laquelle la technologie de transfert est pratiquement parfaite n’est pas nouvelle. Les exemples de perte d’enregistrements historiques ne manquent pas et devraient servir d’avertissement. Par exemple, au cours des années 1960 et 1970, certaines maisons de disques importantes transféraient des disques 78 tours historiques sur bande analogique en vue de leur publication commerciale et détruisaient ensuite les matrices originales à l’insu des ingénieurs responsables du remastering, pour qui il était évident que la qualité du transfert était compromise en raison des limitations des moyens technologiques de l’époque. La conséquence de cette façon de faire est qu’il n’est aujourd’hui plus possible de produire une nouvelle matrice numérique à partir des matrices originales, ce qui signifie que ce matériel est maintenant conservé sous une forme qui comprend des pertes de niveau, du bruit de modulation, du pleurage et du scintillement inhérents à l’utilisation du support analogique, mais qu’on ne retrouvait pas sur les 78 tours originaux.
De plus, les propriétés d’archivage à long terme des nouveaux supports de stockage ne sont pas garanties, comme l’ont montré des exemples de propriétés chimiques autodestructrices de certains supports utilisés il y a une dizaine d’années comme bandes maîtresses. Et c’est également vrai pour la plupart des supports numériques connus qui présentent un risque réel de perte irréversible de caractères numériques excédant les capacités de correction d’erreur, en particulier les supports comme le DAT qui poussent l’utilisation de la technologie de stockage jusqu’à ses limites.
1.4 Solutions de rechange
D’autres options peuvent remplacer la destruction d’enregistrements originaux si les coûts de conservation sont trop élevés. Il est possible de les confier à des organismes d’archivage financés par le gouvernement ou par le secteur privé, tels que les National Sound Archives au Royaume-Uni, dont la politique vise à protéger le matériel qui lui est confié contre les violations de droit d’auteur.
Il n’est pas nécessaire de conserver les enregistrements originaux dans des lieux coûteux, en milieu urbain surtout si, une fois transférés, ces enregistrements ne sont utilisés qu’une fois tous les dix ou vingt ans (au gré des progrès technologiques). Un projet conjoint d’archivage regroupant divers intervenants de l’industrie du disque dans son ensemble, en milieu non urbain, pourrait s’avérer plus économique comme moyen de conservation en plus de favoriser le développement d’une expertise de haut niveau en matière de technologie de conservation. Un tel organisme pourrait bénéficier de l’aide financière provenant de fondations et d’organismes à buts non lucratifs et gouvernementaux, et pourrait même profiter, dans certains pays, d’exemptions fiscales applicables aux activités culturelles et philanthropiques.
Si aucune de ces possibilités ne convient, il est aussi possible de lancer un appel public à l’intention des individus et des organismes susceptibles de vouloir conserver des enregistrements originaux ayant fait l’objet d’un transfert numérique. Ces enregistrements seraient peut-être entre meilleures mains avec un organisme bien choisi ou un spécialiste, bien que l’on peut imaginer que les maisons de disques ne soient pas très favorables à ce genre de proposition. Pourtant, si la destruction d’enregistrements originaux est envisagée parce qu’une version numérique a été produite pour publication, alors le risque de violation du droit d’auteur n’est pas plus élevé que le risque de piratage du CD une fois qu’il est mis sur le marché.
2. Information contenue sur les bandes analogiques
Les enregistrements sur bande analogique, autant les bobines que les cassettes, contiennent beaucoup plus d’information que ce que les appareils de lecture actuels sont en mesure de récupérer, et cette information supplémentaire pourrait contribuer à identifier et éliminer plusieurs types d’imperfections techniques. En voici donc un aperçu.
2.1 Pleurage et scintillement
Le pleurage et le scintillement sont présents sur tous les enregistrements sur bande analogique; ils sont causés par les variations de vitesse survenues lors du processus d’enregistrement original, des déformations physiques du ruban et des imperfections de l’appareil de lecture. Il est surprenant de constater que la plupart des enregistrements magnétiques originaux réalisés à l’époque où l’on utilisait la polarisation magnétique par courant alternatif, soit la grande majorité des enregistrements d’archives, contiennent de l’information qui pourrait permettre d’éliminer presque complètement le pleurage et le scintillement!
La méthode de polarisation magnétique par courant alternatif à haute fréquence, qui se situait habituellement dans une zone de fréquences ultrasoniques de 50 à 200 kHz, était employée pour linéariser le ruban dans la gamme des fréquences audibles, mais cette méthode avait comme effet secondaire d’enregistrer la fréquence de polarisation elle-même. Cette fréquence de polarisation est sujette à l’auto-effacement et ne peut être lue qu’à l’aide d’un appareil possédant certaines caractéristiques : tête de lecture dotée d’un entrefer de très petite dimension, réglage d’azimut de grande précision, bonne courbe de réponse en fréquence. Les appareils de lecture conventionnels ne peuvent habituellement pas récupérer le signal de polarisation enregistré sur la bande, et même s’ils le pouvaient, ce signal se situerait à l’extérieur de la bande passante de tous les enregistreurs audionumériques employés pour transférer le signal.
Si le signal de polarisation est lu et enregistré avec des têtes de lecture et des composantes électroniques appropriées et une bande passante de 250 kHz ou plus, ce signal peut alors servir de référence quant à la vitesse originale du magnétophone utilisé pour l’enregistrement, en supposant que la fréquence de l’oscillateur de polarisation était stable. En procédant à un réajustement temporel du signal pour éliminer toute modulation de phase du signal de polarisation ultrasonique, il est possible d’éliminer le pleurage et le scintillement. Les algorithmes nécessaires à ces opérations sont passablement complexes, en raison de la nécessité d’avoir recours à l’interpolation pour des durées arbitraires. Semblables à ceux employés pour la conversion de fréquences d’échantillonnage, ces algorithmes doivent être efficaces à des fréquences d’échantillonnage beaucoup plus élevées, par exemple, autour de 500 kHz.
Tous ces facteurs, en plus de l’exigence de disposer d’enregistrements de très haute qualité sonore avec une largeur de bande d’environ 250 kHz, rendent ce type de transfert difficile à réaliser actuellement, ce qui devrait tout de même devenir possible avec le temps.
En pratique, les algorithmes d’élimination du pleurage et du scintillement devront être plus complexes encore, étant donné que le déphasage du signal de polarisation enregistré dépend aussi du niveau d’intensité du signal audio enregistré. Par conséquent, des moyens de compenser cet effet devront être intégrés au procédé. De plus, il est nécessaire de prévoir des méthodes permettant de tenir compte des pertes temporaires de signal de polarisation, pour assurer la régularité de la vitesse de lecture lorsque le verrouillage de phase n’est pas constant, puisque l’on ne peut pas présumer qu’il n’y aura aucune perte de niveau dans la récupération du signal de polarisation.
2.2 L’effet d’empreinte
L’effet d’empreinte est un autre problème que l’on rencontre avec les bandes analogiques, soit la magnétisation d’une couche de ruban par contact avec d’autres couches lors de l’entreposage. Encore une fois, il existe des méthodes pour réduire cet effet, mais elles sont efficaces seulement si l’on dispose de la bande originale, car ces méthodes impliquent l’utilisation des propriétés magnétiques du ruban. L’effet d’empreinte est généralement produit par la présence, sur la couche magnétique du ruban, de particules magnétiques de faible coercitivité dans les zones où la coercitivité des particules est généralement beaucoup plus élevée. Cette zone de particule à faible coercitivité est plus sensible à la magnétisation (favorisant ainsi l’effet d’empreinte), mais elle est aussi plus facile à effacer.
On connaît depuis longtemps déjà la méthode qui consiste à utiliser un courant de faible intensité dans la tête d’effacement pour effacer les particules de faible coercitivité à l’origine de l’effet d’empreinte, sans avoir trop d’effet sur les particules à haute coercitivité. Mais cette méthode est peu utilisée, car si l’effet du courant est suffisant pour réduire de façon sensible l’effet d’empreinte, il peut aussi effacer une partie des hautes fréquences du signal utile et altérer la qualité de l’enregistrement. De plus, ces dommages sont irréversibles; si la méthode est mal appliquée, ces résultats ne peuvent jamais être annulés.
Il existe toutefois une méthode d’effacement améliorée qui réduit les risques d’endommager l’enregistrement. Découverte à l’origine dans les années 1950 au département de recherche de la BBC, cette méthode est tombée dans l’oubli jusqu’à ce qu’elle soit redécouverte par l’auteur.
Cette méthode implique de bien comprendre quelles sont les parties de la couche magnétisée du ruban qui sont les plus touchées par l’effet d’empreinte et l’effacement. La tête d’effacement produit son effet le plus prononcé sur le côté de la couche magnétisée le plus « proche » de la tête, et cet effet est moins marqué sur le côté « éloigné » de la couche magnétisée. Contrairement à la croyance répandue, les hautes fréquences (c’est-à-dire les ondes les plus courtes) sont enregistrées sur toute la profondeur de la couche magnétisée, mais les cycles positifs et négatifs des composantes de haute fréquence ont tendance à s’annuler à une certaine distance de la surface de lecture, ce qui signifie que les hautes fréquences sont lues principalement à la surface la plus proche de la tête de lecture. Ainsi, une tête d’effacement placée du côté de la couche magnétisée aura tendance à favoriser l’effacement du signal qui se trouve près de la surface, ce qui entraînera une perte de hautes fréquences lors de la lecture. Toutefois, une tête d’effacement placée sur la face opposée à la couche magnétisée effacera l’effet d’empreinte tout en ayant moins d’effet sur la surface de lecture, ce qui limite la perte de hautes fréquences.
L’utilisation d’un courant de faible intensité et d’une tête d’effacement placée sur le « mauvais » côté du ruban sera donc plus efficace pour effacer l’effet d’empreinte tout en laissant intact le signal utile. Néanmoins, il est recommandé de procéder à des tests avec des enregistrements sans importance, sur des rubans de nature semblable, avant de risquer d’endommager des enregistrements originaux. L’effacement de l’effet d’empreinte pourrait aussi endommager l’information enregistrée dans la composante ultrasonique du signal de polarisation (voir sections 2.1 et 2.6).
D’autres méthodes permettant de réduire l’effet d’empreinte d’un enregistrement original sans risque d’effacement à l’aide des futures technologies de lecture seront présentées dans les sections 2.4 et 2.5.
2.3 Subdivision des pistes
La méthode conventionnelle de lecture de bande analogique emploie une tête unique pour lire une piste sur toute sa largeur, ce qui implique une lecture « moyenne » de l’information répartie sur toute la largeur de la piste. Cette lecture approximative entraîne une perte d’information potentiellement utile que l’on pourrait obtenir si l’on tenait compte des variations de la magnétisation sur toute la largeur de la piste.
Idéalement, cette information devrait être conservée pour des fins d’archivage, et il est possible de le faire en utilisant une tête de lecture multipiste pour subdiviser la piste originale en un plus grand nombre de pistes. La subdivision d’une piste en deux moitiés permet déjà d’améliorer grandement la qualité de l’extraction de l’information, mais la subdivision en 10, 30 ou même 100 pistes donnerait de bien meilleurs résultats. D’un point de vue pratique, un des défis à relever ici est de concevoir une tête de lecture qui puisse subdiviser les pistes sans perte importante d’information entre les pistes (c’est-à-dire s’assurer que les pistes résultant de la subdivision sont réellement contigües), en plus de récupérer le contenu de chaque piste avec un rapport signal/bruit approprié. Les progrès réalisés dans la technologie des têtes de lecture nous rapprochent de notre but. L’accès à ces pistes individuelles permet d’établir un profil de la magnétisation sur toute la largeur de la piste qui peut s’avérer utile pour analyser et compenser les irrégularités de la magnétisation.
Les principaux problèmes associés à la subdivision des pistes sont les suivants : 1) le rendement inapproprié des têtes multipistes pour cet usage; 2) la quantité d’information supplémentaire qui doit être enregistrée, ce qui représente une multiplication du débit par 50 ou 100; 3) la quantité de traitement numérique de signal nécessaire pour traiter toute cette information. Nous croyons que ces trois problèmes seront résolus un jour.
Voici maintenant quelques exemples d’améliorations que l’analyse de la magnétisation sur la largeur du ruban rend possibles.
2.3.1 Correction dynamique d’azimut
Des différences de phase entre les pistes individuelles indiquent des erreurs d’azimut. Ces erreurs peuvent être mesurées et compensées par correction temporelle numérique des pistes individuelles avant que celles-ci ne soient rassemblées pour recomposer le signal sonore original. De plus, il est possible de compenser les écarts de la tête de lecture originale par rapport à un profil en ligne droite (en raison de l’usure de la tête ou d’interférences). Cette forme de correction d’azimut peut être effectuée dynamiquement et rapidement. Elle permettrait par exemple de compenser les variations périodiques rapides d’azimut causées notamment par la déformation du ruban en raison d’une pression exercée sur la bobine.
2.3.2 Correction dynamique des pertes de niveau
Les pertes de niveau momentanées ne sont généralement pas réparties uniformément sur toute la largeur de la piste. En comparant les niveaux des pistes individuelles, en déterminant la piste dont le niveau du signal utile est le plus élevé, et en obtenant les gains relatifs des autres pistes individuelles, il est possible de déterminer le degré de perte de gain de chacune des pistes individuelles (si désiré, en fonction du contenu fréquentiel). En l’absence de perte de niveau, le signal optimal correspondra simplement à la somme des pistes individuelles, mais une somme pondérée (par filtrage de Wiener), dont le gain d’ensemble est déterminé par le niveau du signal le plus élevé des pistes individuelles, favorisera non seulement la compensation en cas de perte de niveau, mais elle permettra également d’obtenir à chaque instant le meilleur rapport signal/bruit pour le signal récupéré.
2.3.3 Réglage latéral dynamique de la tête de lecture
Lorsque plusieurs pistes individuelles sont traitées, le procédé que l’on vient de décrire engendre un effet automatique de compensation dynamique des mauvais réglages de position sur toute la largeur du ruban, ce qui assure un réglage optimal de la position de la tête de lecture à chaque instant.
2.3.4 Réduction de la diaphonie
De plus, la déconvolution appropriée du profil magnétique sur toute la largeur du ruban peut contribuer à réduire certains effets indésirables comme les interférences entre les pistes adjacentes, ce qui permet de réduire la diaphonie entre les pistes ou entre une piste et le bruit indésirable provenant des espaces interpistes. Ces espaces interpistes contiennent parfois des signaux parasites causés par un effacement imparfait du ruban ou parce qu’il a été magnétisé avant l’enregistrement.
2.3.5 Réduction du bruit de modulation
Un des avantages de l’approche par subdivision de piste est que le signal différence contient de l’information relative au bruit du ruban comme tel, c’est-à-dire indépendamment du signal sonore. Cette information permet de récupérer non seulement le spectre du bruit de fond continu à partir de la différence entre les pistes, mais également le bruit de modulation, c’est-à-dire les variations de bruit avec le signal utile.
Les systèmes de réduction de bruit existants tels que les systèmes CEDAR et NO-NOISE ont l’inconvénient de dépendre d’estimations raisonnables du spectre de bruit pour être efficaces. Or il est actuellement impossible d’effectuer cette estimation de manière dynamique pour pouvoir éliminer efficacement les effets de bruit de modulation. Cependant, en utilisant les différences entre les pistes individuelles, on peut établir dynamiquement le spectre de bruit de modulation à chaque instant, ce qui produit une information plus adéquate pour les techniques de réduction de bruit. L’effet subjectif du bruit de modulation est l’un des problèmes les plus sérieux de l’utilisation des bandes magnétiques analogiques; aussi, cette amélioration devrait-elle contribuer à réduire ce problème.
2.4 Lecture à double-face
Nous avons suggéré à la section 2.2 l’emploi d’une tête d’effacement placée sur la face du ruban opposée à celle où est placée la tête de lecture. Il est également possible de récupérer de l’information additionnelle d’une bande maîtresse en utilisant une tête de lecture sur chaque face du ruban. Évidemment, une tête de lecture placée sur le « mauvais » côté du ruban est, par le fait même, à distance de la couche voulue du ruban, ce qui entraîne une perte de hautes fréquences assez importante. Toutefois, les futurs progrès relatifs aux têtes de lecture devraient permettre de réduire ces pertes et d’obtenir un meilleur rapport S/B, à tout le moins jusqu’au centre de la gamme des fréquences audibles.
Si le signal de sortie des deux têtes est synchronisé (ce qui peut en soi nécessiter le traitement numérique du signal), l’avantage de cette lecture à double face est que les deux têtes sont plus sensibles à la magnétisation de leur face respective de la couche magnétisée, ce qui donne une indication du profil de magnétisation sur toute l’épaisseur de la couche. Ceci peut contribuer à différencier le signal utile (dont la magnétisation est plus élevée près de la surface) et l’effet d’empreinte sur la face opposée du ruban. Une combinaison linéaire appropriée du signal de sortie des deux têtes permettra alors d’annuler l’effet d’empreinte.
2.5 Lecture de la magnétisation non transversale
Les têtes de lecture conventionnelles ne peuvent « lire » les enregistrements magnétiques que dans une seule direction par rapport au défilement de la bande, soit une composante transversale parallèle à la surface de la bande. Toutefois, une lecture de la composante magnétique perpendiculaire à la surface de la bande offre un moyen supplémentaire pour séparer le signal utile des signaux parasites et pour séparer les différents bruits de modulation et les formes de distorsion. Dans le cas de l’effet d’empreinte, nous savons aujourd’hui que l’angle de magnétisation par rapport à la surface du ruban n’est pas le même sur les deux faces du ruban. Cette caractéristique pourrait donc s’avérer utile pour réduire l’effet d’empreinte, notamment en effectuant une combinaison linéaire appropriée des composantes magnétiques transversale et perpendiculaire. La technologie employée pour les têtes de lecture pourrait par exemple s’appuyer sur l’effet Hall.
2.6 Analyse du signal de polarisation
Le signal de polarisation enregistré sur le support (voir section 2.1) peut contenir de l’information additionnelle utile pour une lecture avec niveau de distorsion réduit. La fréquence de polarisation enregistrée et ses harmoniques seront modulées en amplitude et en phase par l’information contenue dans le signal original. Une meilleure compréhension des mécanismes de distorsion associés à la polarisation par courant alternatif permettra peut-être d’utiliser cette information additionnelle, à l’aide de traitement de signal non linéaire pour reproduire une version du signal utile dont le niveau de distorsion serait moins élevé que ne le permet une lecture directe comme telle. Comme nous l’avons vu dans la section 2.1, ce procédé nécessite une bande passante beaucoup plus large que la gamme des fréquences audibles.
Par ailleurs, le phénomène de repliement de spectre, qui est causé par le chevauchement des bandes latérales résultant de la modulation de la fréquence de polarisation et de la bande de base audio, est une cause importante de la perte de qualité des enregistrements produits avec des fréquences de polarisation inférieures à 100 kHz. La récupération du signal de polarisation permettra peut-être de traiter et d’éliminer le repliement par ordinateur.
2.7 Méthodes combinées
Ces différentes méthodes peuvent être combinées; toutefois, la conception d’une tête à double-face subdivisée en 100 pistes individuelles, chacune sensible aux composantes magnétiques transversale et perpendiculaire, et sensible à une bande passante de 500 kHz de qualité audio avec un bon rapport S/B, pose de formidables problèmes pratiques, si l’on pense aux normes actuellement en vigueur!
Même si ces problèmes étaient résolus, le taux de transfert des données nécessaire serait des milliers de fois plus élevé que celui des technologies audionumériques conventionnelles, ce qui exigerait, pour le stockage des données, des enregistreurs au débit comparable ou supérieur à celui des enregistreurs TVHD. Le type de traitement numérique de signal nécessaire pour utiliser cette information serait également formidable, des milliers de fois plus complexe que ce qui est possible actuellement d’un point de vue économique.
Des applications très partielles de ces méthodes sont actuellement possibles; mais nous croyons qu’il est urgent de mettre au point la subdivision à deux pistes, en particulier pour le matériel monophonique, ce qui permettrait d’utiliser le signal différence (ou pour le dire de manière plus technique, la plus petite des principales valeurs propres de la matrice spectrale à deux canaux) pour déterminer le spectre du signal de bruit et rendre possible la correction dynamique d’azimut.
3. DISQUES À SILLONS
La récupération de l’information à partir d’enregistrements dont la matrice a été réalisée sur disque 78 tours pose des problèmes aussi exigeants que ce que l’on a vu précédemment avec les bandes. Il faut noter toutefois que des technologies antérieures de récupération de signal ont su utiliser une partie de l’information sacrifiée par la technologie de transfert numérique!
Examinons ici un certain nombre d’aspects difficiles ou impossibles à récupérer par transfert numérique.
3.1 Bruit impulsif
Un des problèmes que posent les enregistrements sur support 78 tours est celui des bruits de surface causés par la présence d’égratignures sur la surface du disque, ce bruit étant composé d’un grand nombre d’impulsions. La première méthode de détection et d’élimination d’impulsion a été mise au point chez EMI vers la fin des années 1940, et plusieurs méthodes semblables ont été développées par la suite, par l’auteur et Peter Craven au début des années 1970, et mises en marché par Packburn. Récemment, CEDAR et NO-NOISE ont mis au point des méthodes numériques employant une technique très perfectionnée de détection d’impulsion par prédiction et de substitution par interpolation.
3.1.1 Composantes ultrasoniques
Cependant, de tels procédés compromettent l’intégrité du signal original et produisent ainsi une sonorité de moins bonne qualité. Il est donc essentiel de minimiser ces dommages. Pour séparer les impulsions du signal musical comme tel, la bande passante doit être assez large, de préférence supérieure à 40 kHz. La durée d’une impulsion étant inversement proportionnelle à la largeur de bande, les impulsions courtes seront détectées si les bandes passantes sont larges. De plus, le signal musical comporte peu d’énergie dans la zone supérieure à 15 kHz; la localisation des impulsions s’en trouve facilitée dans la zone ultrasonique située au-dessus de 15 kHz — en fait, le procédé employé par EMI dans les années 1940 repérait les impulsions dans le temps à l’aide des composantes ultrasoniques.
La technologie actuelle d’enregistrement numérique est toutefois limitée à une bande passante de 20 kHz; elle sacrifie donc l’information ultrasonique et brouille la durée des impulsions, ce qui, par le fait même, rend la séparation des impulsions et de la musique beaucoup plus difficile à réaliser. La largeur de bande idéale pour détecter l’information nécessaire à l’élimination des impulsions se situe entre 50 et 100 kHz.
3.1.2 Capteur stéréophonique
Il existe un autre type d’information susceptible d’améliorer la séparation des impulsions du signal utile. Cette méthode, employée par l’auteur dans ses travaux avec Craven et par Packburn, consiste à utiliser un capteur stéréophonique qui lit séparément les signaux gravés sur les deux flancs du sillon. Nous savons aujourd’hui que la plupart des impulsions surviennent sur un seul flanc à la fois. Dans le cas des disques monophoniques, l’impulsion isolée peut être détectée en obtenant la différence entre les signaux des deux flancs. Dans la réalité, diverses formes de distorsions interfèrent avec ce signal différence « vertical », mais l’emploi de cette technique à deux canaux contribue tout de même à rendre la détection des impulsions beaucoup plus précise.
De plus, comme la plupart des impulsions se produisent sur un flanc à la fois, il est possible de déterminer sur quel flanc survient l’impulsion et transférer la captation du signal utile sur l’autre flanc — une technique connue sous le nom de « groove-wall switching », que l’on pourrait traduire par « alternance de flanc de sillon ». Cette technique pose tout de même un certain nombre de problèmes, dont l’effet de diaphonie ou la présence résiduelle de bruits impulsifs et les effets de distorsion de contact, résultant du contact de la pointe de lecture, sur les signaux de chacun des flancs.
3.1.3 Information combinée
Néanmoins, si l’on peut capter séparément les signaux des deux flancs du sillon avec une bande passante de 50 kHz ou plus, l’information ainsi obtenue pourrait être traitée de façon beaucoup plus précise afin d’éliminer les bruits impulsifs tout en minimisant la distorsion du signal utile. Pour ce faire, nous devons compter sur une technologie d’enregistrement numérique spécialisée, car la bande passante des supports numériques stéréophoniques standards ne convient pas à ces applications. Le traitement numérique du signal nécessaire pour optimiser l’usage de cette information n’est pas encore au point, mais son développement ne saurait tarder, surtout s’il y a une certaine demande pour cette technologie (par exemple, une maison de disques importante pourrait passer une commande auprès d’un des fournisseurs spécialisés comme CEDAR ou NO-NOISE pour qu’il mette au point un tel système).
3.2 Distorsion de contact
La pointe de lecture idéale devrait capter l’information par contact (dont la surface serait un point ou linéaire) avec chaque flanc du sillon, mais le rayon de contact des pointes de lecture actuelles est orienté en direction du déplacement de la pointe dans le sillon. Ce rayon de contact est à l’origine de ce que l’on nomme « distorsion de contact », dont la théorie a été formulée notamment par Shiga et Cooper dans les années 1960. Comme l’auteur le remarquait en 1975, la distorsion de contact a comme effet non seulement d’ajouter de la distorsion non linéaire au signal utile, mais elle prolonge également la durée des impulsions non désirées, ce qui augmente le bruit impulsif. L’utilisation d’une pointe de lecture dont le rayon est le plus petit possible est donc nécessaire à la captation optimale du signal afin d’atténuer le bruit impulsif.
D’un point de vue pratique, il existe toutefois un seuil minimal pour la taille du rayon d’une pointe de lecture; aussi la correction électronique de la distorsion de contact, comme la technique de Cooper datant des années 1960 appelée « skew sampling », est le seul moyen concrètement réalisable de réduire davantage la distorsion de contact. Mais une telle technologie de correction impose elle-même trois exigences importantes en terme de récupération d’information : 1) les signaux des deux flancs du sillon doivent être captés séparément puisqu’ils doivent être traités séparément afin de limiter la distorsion de contact; 2) la bande passante du signal récupéré doit excéder les limites de la gamme des fréquences audibles, et elle doit aussi être linéaire en phase, puisque le fait même d’appliquer un filtre passe-bande avant la correction de distorsion introduit des erreurs; 3) une mesure doit être prise non seulement du point de contact de la pointe de lecture, mais aussi de la vitesse de déplacement dans le sillon à chaque point de la lecture, puisque ces deux paramètres doivent être connus pour corriger la distorsion de contact.
La technologie de transfert numérique existante ne conserve pas cette information, ce qui rend la réduction de la distorsion de contact et la réduction de la durée des impulsions pratiquement impossibles. La future technologie offrira des moyens de récupérer et stocker cette information et de reproduire un signal à large bande exempt de distorsion de contact pour chaque flanc du sillon. Un signal de cette qualité sera plus approprié et plus utile pour les méthodes de réduction d’impulsion décrites à la section 3.1 que ne l’est le signal de sortie d’une cartouche de lecture.
3.3 Profil du flanc du sillon
En principe, il y a davantage d’information qui peut être récupérée d’un disque original ou de parties métalliques. Idéalement, il faudrait non seulement reproduire une « moyenne » du signal au point de contact de la tête sur chaque flanc du sillon, mais il faudrait enregistrer le signal à différentes hauteurs du flanc du sillon, ce qui permettrait de reproduire le profil complet du sillon.
Cette méthode subdivise le signal en un certain nombre de « pistes » parallèles pour chaque flanc du sillon, soit une piste pour chaque hauteur, de manière semblable à la technique de subdivision décrite plus tôt pour la lecture d’enregistrements sur bande. L’analyse des différences entre ces pistes peut servir à une analyse du bruit semblable à celle décrite à la section 2.3.5, mais elle permettrait aussi de déterminer la hauteur à laquelle les effets de l’usure du disque et des bruits captés sur le fond du sillon et la surface entre les sillons sont les moins importants. Cette information permettrait de varier la hauteur de la pointe de lecture et le profil de contact par traitement de signal adaptatif pour optimiser la lecture à chaque instant.
Comme pour la méthode de subdivision des pistes d’une bande magnétique, cette méthode d’analyse du flanc du sillon est extrêmement exigeante en terme de stockage d’information et de traitement de signal; aussi, cette technologie n’a-t-elle pas encore vu le jour.
La technologie de lecture nécessaire n’existe pas non plus. On pourrait envisager de recourir à la technologie optique de lecture, mais cette approche pose de nombreux problèmes en raison de la longueur d’onde de la lumière (qui est trop élevée!) et du fait que la lecture optique n’éloigne pas les interférences, contrairement à la lecture mécanique avec une pointe de lecture. La meilleure façon de récupérer l’information relative au profil est probablement d’employer un certain nombre de pointes de lecture de différentes dimensions, de synchroniser les enregistrements par traitement numérique de signal, d’éliminer la distorsion de signal de chacun de ces enregistrements, et finalement de traiter à nouveau les signaux de manière à reproduire le profil du flanc du sillon.
L’information concernant le profil du sillon peut être utilisée pour la correction des différences de l’inclinaison longitudinale du burin de gravure, y compris une forme dynamique de correction semblable à la correction dynamique d’azimut décrite en 2.3.1.
3.4 Autres paramètres
En plus des paramètres géométriques de la surface du sillon, d’autres facteurs d’ordre mécanique, chimique et physique peuvent être pris en considération relativement aux parties métalliques et aux disques, tels que le stress, l’élasticité, le coefficient de friction, etc. Chacun de ces facteurs peut fournir de l’information supplémentaire permettant de détecter et de corriger la distorsion dans le signal reproduit. Il est difficile de prédire quels paramètres s’avéreront utiles plus tard, mais il est certain qu’ils peuvent être récupérés seulement à partir des enregistrements originaux ou des matrices.
Les effets de l’élasticité pourraient être mesurés en effectuant plusieurs lectures d’un même disque avec la même tête de lecture, mais avec des niveaux de pression différents pour chaque lecture. Les différents enregistrements seraient ensuite synchronisés numériquement. Le signal différence entre les enregistrements devrait fournir de l’information au sujet des propriétés physiques du disque (si l’on fait abstraction des signaux bruiteux causés par les interférences).
3.5 Autre information
En plus de l’information relative aux flancs du sillon et à la vitesse de lecture, d’autres types d’information pourraient contribuer à améliorer la récupération du signal : 1) lecture de la surface entre les sillons, qui pourrait permettre d’établir des corrélations avec les bruits provenant du sillon lui-même; 2) lecture du fond du sillon, pour les mêmes raisons; 3) mesures des rapports physiques entre les sillons adjacents, notamment la distance et les écarts temporels, qui contribueraient à la réduction des effets pré- et post-écho (l’équivalent pour le disque de l’effet d’empreinte) et à la détection de perturbations périodiques qui pourront être filtrées au moyen d’un filtre en peigne.
3.6 Contenu de l’information
La quantité d’information susceptible d’être récupérée à partir des disques originaux implique des débits de transmission de données 50 fois plus grands que celui d’un signal audionumérique conventionnel, en raison de la bande passante élargie, de l’utilisation de canaux stéréo et de la subdivision des pistes pour enregistrer le profil du sillon et, si nécessaire, l’information relative à l’élasticité. Comme c’était le cas avec les exemples d’enregistrements sur bande analogiques, la méthode discutée ici demande un support d’enregistrement beaucoup plus puissant (un enregistreur vidéo numérique aurait un débit approprié pour cette méthode), une capacité accrue en matière de traitement numérique du signal, et finalement de multiples lectures de la source dont on mesurerait soigneusement les différents paramètres physiques pertinents.
Bien que cette méthode soit un peu moins exigeante que celle applicable aux enregistrements sur bande analogiques, il faudra tout de même encore bien du temps avant que la technologie appropriée ne soit mise au point, et c’est sans compter la possibilité d’obtenir de nouvelles données inattendues (voir section 3.4) qui demanderaient de nouveaux moyens techniques pour améliorer encore plus la récupération du signal utile.
4. Copies des matrices
Bien que ces techniques de traitement soient recommandées pour le traitement des matrices, des méthodes semblables peuvent être appliquées également aux copies de première génération lorsque les originaux ne sont plus disponibles. Si la perte d’information causée par le processus de copie est irréversible, on devrait à tout le moins être en mesure de limiter l’effet des imperfections inhérentes au support utilisé pour la copie. Ces améliorations devraient être assez significatives du point de vue de la qualité.
Ceci vaut pour les copies des bandes maîtresses, sur bande ou sous forme de pièces ou de disques gravés à partir des bandes maîtresses. Bien souvent, la première parution d’un disque vinyle était gravée à partir de bandes maîtresses, en particulier dans le pays « d’origine » de l’enregistrement. C’est pourquoi les parties originales et les copies neuves inutilisées de ces parutions doivent être considérées comme ayant valeur d’archives.
Dans bien des cas, des bandes maîtresses ont été perdues ou égarées, ou elles ont subi une certaine détérioration — par exemple des pertes de niveau. Dans ces cas, les copies réalisées très tôt sur disque seront peut-être les meilleures sources existantes.
Ajoutons qu’il est parfois difficile de savoir si une bande mal identifiée ou mal étiquetée est un original ou une copie. Il arrive qu’une prétendue « copie » soit en fait un original. On ne peut alors trancher qu’après une écoute attentive et certaines recherches.
C’est donc pour ces raisons qu’il faut se garder de détruire des « copies », jusqu’à ce qu’on soit absolument certain qu’elles ne nous offrent pas d’information utile sur l’original.
5. Imperfections des convertisseurs numériques
Aux problèmes associés à la récupération de l’information nécessaire à partir d’un enregistrement original, on doit ajouter celui des imperfections du support de transfert. La naïveté des premiers jours de l’audionumérique, alors qu’on croyait le médium pratiquement « parfait », a cédé la place à une meilleure compréhension des mécanismes par lesquels l’oreille entend des défauts censés être négligeables selon les mesures audio traditionnelles. Des travaux sur la modélisation de l’effet de masque dans la perception auditive, basés sur les recherches de Louis Fielder des laboratoires Dolby et Bob Stuart de Meridian Audio, ont démontré les imperfections particulièrement audibles de la technologie des convertisseurs analogiques-numériques. Ceci ne devrait pas nous surprendre puisque de tels défauts sont audibles non seulement pour les professionnels de l’audio, mais également pour les auditeurs non spécialistes qui sont en mesure de percevoir une perte de qualité des enregistrements qui ont été transférés numériquement.
Ces défauts audibles sont parfois causés par ce que l’on nomme « scintillement » ou « gigue » (en anglais, jitter) qui désigne de petites variations dans la synchronisation des caractères ou éléments numériques. Tous les supports d’enregistrement numériques et les interconnexions de signal introduisent des quantités audibles de scintillement et la plupart des convertisseurs numériques-analogiques ne sont pas équipés de mécanisme de suppression de scintillement approprié, ce qui explique que chaque lecteur numérique possède sa propre « sonorité ». Toutefois, les difficultés relatives à la suppression du scintillement des convertisseurs numériques-analogiques ont été résolues et le choix d’un support de transfert numérique ne devrait plus poser de problème de qualité, à condition qu’il n’y ait pas de perte de caractères numériques corrigés.
Le scintillement causé par le convertisseur analogique-numérique d’origine ne peut cependant pas être éliminé ultérieurement, ni les imperfections causées par la non-linéarité, le bruit de modulation et les cycles limites du convertisseur analogique-numérique. Actuellement, la qualité de la plupart des convertisseurs analogiques-numériques utilisés pour le transfert numérique laisse à désirer et les imperfections qu’ils engendrent sont audibles même lorsqu’il s’agit de vieux disques et de vieilles bandes d’archives. Un important travail d’écoute est nécessaire à l’amélioration des convertisseurs, lesquels devraient être sélectionnés et utilisés de manière à minimiser les effets du scintillement dans le processus de conversion lui-même.
6. Conclusions
Ce texte a démontré que la technologie de transfert numérique actuelle est incapable de récupérer la majeure partie de l’information contenue sur les matrices et les enregistrements analogiques originaux, mais que les futures technologies devraient être en mesure de le faire. Nous avons décrit certaines des améliorations que les technologies de transfert devraient offrir, bien qu’il faudra attendre encore un certain temps en raison des limitations technologiques actuelles.
Nous avons affirmé que la qualité sonore de la technologie de transfert actuelle laissait à désirer.
Par conséquent, nous recommandons fortement que les enregistrements originaux ou leurs copies les plus directes soient conservés, étant donné le fait que les copies numériques actuelles ne peuvent remplacer les originaux en ce qui concerne l’intégrité et la qualité de l’information susceptible d’être utilisée par les futures technologies. Le potentiel d’amélioration peut s’avérer très important : par exemple, l’élimination de l’effet d’empreinte, du bruit de modulation, du pleurage et du scintillement des enregistrements analogiques originaux.
Dans la mesure où le transfert numérique est requis à des fins d’archivage (pour réaliser des copies de sécurité ou en raison de la détérioration physique de l’original), il est recommandé de subdiviser chaque piste monophonique de l’original en deux pistes, comme nous l’avons décrit plus haut (correspondant aux deux flancs du sillon d’un disque ou en subdivisant les pistes de lecture d’une bande analogique) de manière à pouvoir traiter l’information supplémentaire en cas de perte de l’original. Nous recommandons également que les copies de sécurité soient réalisées à l’aide des meilleurs convertisseurs analogiques-numériques disponibles, les convertisseurs actuels compromettant sérieusement la qualité du procédé.
Social top