Pregunta ¿Qué es el valor de byte-offset en hadoop o en java?


Un poco confundido con este término, el valor de compensación de bytes se trata como clave de mapa en el programa hadoop Map reduce. En primer lugar, ¿cuál es el valor de compensación de bytes?

En segundo lugar, arroje algunas luces sobre cómo se genera y cómo ver este valor de compensación de bytes.

Gracias Raj


7
2018-04-03 12:51


origen


Respuestas:


Byte offset es el número de caracteres que existe contando desde el principio de una línea.

por ejemplo, esta linea

what is byte offset?

tendrá un desplazamiento de bytes de 19. Esto se usa como valor clave en hadoop


4
2017-07-18 17:48



Básicamente, un desplazamiento es un número entero que se utiliza para encontrar la distancia (dirección absoluta) con respecto a la dirección base.

Supongamos un archivo de texto con los siguientes datos

Mundo de la informática
Computación cuántica

ahora el desplazamiento para la primera línea es 0 y la entrada para el trabajo hadoop será <0, Computer Science World> para la segunda línea el desplazamiento será <23, Computación cuántica>

cada vez que pasamos el archivo de texto al trabajo de hadoop. Calcula internamente el byte offset.


1
2018-03-11 23:48



El desplazamiento de bytes es el recuento de bytes que comienza en cero. Un personaje o espacio suele ser de un byte cuando se habla de Hadoop. Pero mira esta pregunta si quieres saber más: ¿Cuántos bits en un personaje?


0
2017-10-27 18:58