يشتمل السرد الصوتي على الخطاب والمؤثرات والموسيقى أو الصمت، ويمكن أن تعمل عناصر السرد الصوتي في آنٍ بشكل متبادل أو متزامنة بعضها مع بعض، أو مع المشاهد المصورة.
للأصوات تأثير بالغ الأهمية في تأويل واستيعاب القصة السمعية البصرية، إلا أنه غير ملحوظ بشكل واضح وليس الصمت أقل وسائل التعبير فعالية. ولها وقعها في تفسير هذه المشاهد، لكنها أيضاً تؤثر في تفسير العناصر الصوتية الأخرى، حيث إن سماع موسيقى حزينة في خلفية الحديث تجعل مفهوم الكلام مختلفاً تماماً عما لو كانت هذه الموسيقى مرحة أو رنانة مثلاً.
إن السمع والاستماع شيئان مختلفان تماماً. والحقيقة أن الناس محاطون بالأصوات في حياتهم اليومية، ما يؤدي إلى أن يغفل المشاهد الانتباه عن السرد الصوتي، وهكذا يظل المعنى المنشود منها دون تحليل أو تفسير.
ولعل أكثر الناس لم يعتادوا الاستماع بإصغاء، وهذه عبارة عن مهارة من الممكن تعلمها. إن الانتباه لما تسمع هو الخطوة الأولى في تعلم الإنصات والفهم وخلق السرد الصوتي.