Supone la agrupación de las imágenes de tipo I, P y B dentro de una secuencia específica conocida cómo “Group of Pictures” (GOP). El grupo empieza y acaba con una imagen de tipo I, para mantener el acceso aleatorio al grupo, contiene imágenes de tipo B y P en una secuencia específica determinada por el diseñador. Un grupo puede ser de diferentes dimensiones para adaptarse al tipo de video que tiene que ser codificado, por ejemplo es mejor utilizar un grupo pequeño para unas imágenes que contienen mucho movimientos rápidos de acción y escenas altamente complejas.
Las dimensiones típicas de un grupo van desde 8 hasta 24 imágenes. Los tamaños de los GOP más utilizados son de 12 para sistemas de 50 Hz y 16 para sistemas de 60 Hz. Los GOP son opcionales para un flujo binario en MPEG2, pero resultan esenciales en DVD video, para generar una base de tiempos SMPTE. Un flujo binario sin encabezado GOP puede accederse directamente como un punto específico utilizando el encabezado de la secuencia.