Pregunta Sitecore 7 indexación pdf


Intento indexar archivos PDF con Sitecore 7. Instalé IFilter, pero recibí el siguiente error en el registro de rastreadores:

ManagedPoolThread #17 09:24:20 WARN  LuceneIndexOperations : Update : Could not build document data 4433434-3443-3223-91c4-233232. Skipping.
Exception: System.Runtime.InteropServices.COMException
Message: Error HRESULT E_FAIL has been returned from a call to a COM component.
Source: mscorlib
   at System.Runtime.InteropServices.ComTypes.IPersistFile.Load(String pszFileName, Int32 dwMode)
   at Sitecore.ContentSearch.Extracters.IFilterTextExtraction.FilterLoader.LoadAndInitIFilter(String fileName, String extension)
   at Sitecore.ContentSearch.Extracters.IFilterTextExtraction.FilterReader..ctor(String fileName)
   at Sitecore.ContentSearch.ComputedFields.MediaItemIFilterTextExtractor.ComputeFieldValue(IIndexable indexable)
   at Sitecore.ContentSearch.ComputedFields.MediaItemContentExtractor.ComputeFieldValue(IIndexable indexable)
   at Sitecore.ContentSearch.LuceneProvider.LuceneDocumentBuilder.AddComputedIndexFields()
   at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.GetIndexData(IIndexable indexable, IIndexable latestVersion, IProviderUpdateContext context)
   at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.BuildDataToIndex(IProviderUpdateContext context, IIndexable version, IIndexable latestVersion)
   at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.<>c__DisplayClass7.<Update>b__0(Item version)

Lo que tengo que hacer es trabajar porque en la documentación de Sitecore dijeron que debía funcionar de manera inmediata.


5
2017-08-01 15:47


origen


Respuestas:


Tuve el mismo problema y recibí del soporte de Sitecore la siguiente respuesta (funciona bien después):

1) Copie todos los archivos .dll de Adobe iFilter en la carpeta "\ System32 \ Inetsrv". Este es el directorio de trabajo para IIS en Windows Server. Los archivos .dll de Adobe iFilter se almacenan en la carpeta "C: \ Archivos de programa \ Adobe \ Adobe PDF iFilter 9 para plataformas de 64 bits \ bin" de forma predeterminada. También puede usar la herramienta "IFilter Explorer" para detectar la carpeta donde se almacenan los archivos .dll: http://www.citeknet.com/Products/IFilters/IFilterExplorer/tabid/62/Default.aspx Para más detalles por favor vea la captura de pantalla: http://screencast.com/t/xmWukanM+

2) Eliminar todos los archivos en la carpeta "Website / App_Data / MediaCache";

3) Reconstruir los índices de búsqueda de Sitecore (Sitecore -> Panel de control -> Indexación -> Indexing Manager);

4) Borre el caché de Sitecore (la herramienta http: // {nombre de host} /sitecore/admin/cache.aspx); 5) Reinicie el IIS;


5
2017-08-01 16:00



Aquí está la solución que tomé, ya que no me gustó la idea de copiar DLL relacionados con iFilter en la ruta del sistema.

  • instalar Adobe IFilter 9 (Usé este enlace). Nota versión 9 Es esencial ya que a partir de la versión X archivo abandonado basado interfaz.
  • agregar ubicación de filtro a la variable de entorno PATH. En mi caso fue %ProgramFiles%\Adobe\Adobe PDF iFilter 9 for 64-bit platforms\bin\.
  • correr iisreset
  • vuelva a la aplicación Sitecore y ejecute la reconstrucción de índices para los índices necesarios.

Por tu consideración:

  • al intentar resolver el problema, concedí acceso completo a la carpeta IFilter para la cuenta del grupo de aplicaciones. No creo que sea necesario, ya que lo quité al final y todo seguía funcionando bien.

Después de estos pasos, la indexación de PDF comenzó a funcionar bien en mi instancia de Sitecore 7 que se ejecuta en Windows 8.1.


1
2017-11-25 23:56