Question:
Comment déterminer le format de ce fichier audio?
asheeshr
2013-03-27 19:20:54 UTC
view on stackexchange narkive permalink

J'ai un fichier audio dans un format inconnu. Comment devrais-je essayer de déterminer son format?

Est-il également possible de le faire par observation manuelle et en n'utilisant aucun outil automatisé?

Trois réponses:
#1
+11
Peter Andersson
2013-03-27 19:49:04 UTC
view on stackexchange narkive permalink

En ce qui concerne l'approche automatisée, la commande de fichier est la recommandation classique. C'est un outil qui tente de deviner le type de fichier à partir des données contenues dans le fichier. Il implémente la plupart des signatures de format de fichier bien connues via libmagic. Si vous avez un fichier composite, vous pouvez essayer binwalk qui essaiera de trouver des fichiers en tant que sous-ensembles d'un fichier plus volumineux.

Si vous voulez suivre la voie manuelle, vous devez faire correspondre un sous-ensemble du fichier à une signature ou un modèle connu. Cela s'applique en particulier aux formats de fichiers susceptibles d'être compressés car les modèles de données seront moins réguliers. Par conséquent, vous devez généralement trouver un modèle, généralement appelé signature ou empreinte digitale, dans la structure du fichier. La plupart des formats de fichiers ont des nombres magiques dans l'en-tête ou le pied de page du fichier afin de permettre aux programmes de vérifier facilement le type de fichier qu'ils sont sur le point de charger. Il existe quelques bonnes ressources pour les signatures de fichiers bien connues:

#2
+5
0xC0000022L
2013-03-27 20:38:25 UTC
view on stackexchange narkive permalink

Les suggestions de Peter sont, comme d'habitude, excellentes. J'aimerais ajouter quelques points.

  • si vous avez accès à un programme utilisant ce format, vous pouvez toujours procéder à une ingénierie inverse afin de trouver des détails sur le format ou même simplement signatures qu'il recherche (en supposant par exemple qu'il contient des échantillons sonores mais qu'il s'agit d'un format propriétaire et peu connu)
    • cela pourrait également donner des indices sur les bibliothèques utilisées pour accéder au format qui à son tour donne des indices sur le format (pensez à IDA FLIRT / FLAIR)
  • sinon un lecteur multimédia tel que VLC peut également être une bonne méthode pour obtenir des détails ( Ctrl + J et Ctrl + I ). Autrement dit, vous essayez simplement de l'ouvrir et de voir quelles informations multimédias le lecteur peut vous fournir. Les bons joueurs ne vous obligeront pas à coller une extension de fichier particulière sur le fichier avant de l'ouvrir. Mais méfiez-vous des exploits potentiels (par exemple, faites-le dans un environnement sandbox)
#3
+5
nneonneo
2013-03-31 13:41:37 UTC
view on stackexchange narkive permalink

En plus des suggestions fines dans les autres réponses, voici quelques suggestions spécifiques à l'audio:

  • Si vous savez combien de temps la lecture de l'audio est (approximativement), calculez la valeur approximative débit binaire du fichier audio. Cela vous dira s'il est compressé ou non, et le taux de compression peut vous dire à peu près à quoi vous pourriez avoir affaire. Par exemple, 4kbps ~ 32kbps indique un codec vocal, 64 ~ 256kbps est un son compressé ordinaire (AAC / MP3 / Ogg Vorbis), 512 ~ 3072kbps signifie probablement un codec sans perte, et beaucoup plus élevé signifie non compressé ou faiblement compressé (par exemple ADPCM, PCM) audio. À son tour, cela peut vous indiquer ce qu'il contient (discours, musique, effets sonores, etc.).
  • Si vous pensez qu'il pourrait être faiblement compressé, essayez d'ouvrir le fichier en tant que flux PCM brut dans votre éditeur audio préféré (par exemple Audacity) et l'écouter. Il y aura probablement une quantité insensée de bruit s'il est compressé de quelque manière que ce soit, mais certains formats (par exemple ADPCM) peuvent toujours être audibles dans cette circonstance s'ils sont à débit binaire relativement constant. J'ai utilisé cette tactique dans le passé pour élaborer le contenu parlé d'un échantillon audio (encore inconnu) que j'ai reçu. En effet, cette tactique peut même révéler le contenu de fichiers mal chiffrés et non compressés en exploitant la reconnaissance humaine de formes.
  • Vérifiez les morceaux de métadonnées dans le fichier - chaînes , un examen rapide de le premier et le dernier morceau du fichier dans un éditeur hexadécimal, ou simplement la recherche de chaînes que vous pourriez vous attendre à voir.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...