35 votos

Pentaho vs Pila de Microsoft BI

Mi empresa está invirtiendo fuertemente en el MS BI Pila (SQL Server Reporting Services, Servicios de Análisis y de Integración de Servicios), pero quiero tener un vistazo a lo que el aparentemente más se habla acerca de la alternativa open source Pentaho.

He instalado una versión, y lo tengo funcionando bastante sencilla. Así que es bueno. Pero no he realmente el tiempo para empezar a usarlo para el trabajo real para obtener una comprensión completa del paquete.

¿Alguno de ustedes tiene alguna idea de en qué son los pros y los contras de Pentaho vs MS BI, o de cualquier enlace a este tipo de comparaciones?

Muy apreciada!

53voto

Stradas Puntos 992

He revisado varios Bi pilas, mientras que en un camino para bajar de Objetos de Negocio. Muchos de mis comentarios son de preferencia. Ambos conjuntos de herramientas son excelentes. Algunas cosas son cómo yo prefiero el helado de chocolate fudge brownie más de chocolate.

Pentaho tiene algo realmente inteligente chicos que trabajan con ellos, pero Microsoft ha estado en una bien financiada y bien planificada la ruta. Tenga en mente MS todavía son los perdedores en el mercado de bases de datos. Oracle es el rey aquí. Para ser competitivos MS ha estado regalando un montón de golosinas cuando usted compra la base de datos y se han visto obligados a reinventar su plataforma un par de veces. Sé que esto no es sobre la base de datos, pero el DB batalla tiene un motivo MS para regalar un lote con el fin de agregar valor a su pila de fichas.

1.) Plataforma
SQL server no se ejecuta en Unix o Linux, por lo que son automáticamente excluidos de este mercado. Windows es aproximadamente el mismo precio que algunas versiones o Unix. Windows es bastante barato y se ejecuta faily bien ahora. Me da tanto problema como Linux.

2.) OLAP
Análisis de los servicios se reinventó en 2005 (el actual es de 2008) a través de la versión 2000. Es una orden de magnatude más poderosos en el año 2000. Pentaho (Mondrian) no es tan rápido una vez que se obtienen grandes. También tiene algunas características. Es bastante bueno, pero hay menos en la forma de herramientas. Tanto el apoyo de Excel como la plataforma en la que se esscential. La MS es la versión más robusta.

3.) ETL
MS - DTS ha sido reemplazado con SSIS. De nuevo, el fin de magnatude aumento en la velocidad, potencia y capacidad. Controla cualquier y todos los datos de movimiento o el control de un programa. Si no puede hacerlo usted puede escribir un script en Powershell. A la par con la Informatica en la versión 2008. Pentaho - Mucho mejor de lo que solía ser. No tan rápido como me gustaría pero no puede hacer casi todo lo que yo quiero hacer.

4.) tablero de instrumentos
Pentaho ha mejorado este. Es una especie de incómodo y hostil a desarrollar, pero en realidad no hay un verdadero equiv por la SRA.

5.) informes
MS informes es muy potente, pero no es tan difícil de usar. Me gusta ahora, pero odiaba al principio, hasta que llegué a conocer un poco mejor. Yo había estado usando crystal reports y el MS generador de informes es mucho más potente. Es fácil hacer cosas difíciles en la EM, pero un poco más difícil de hacer las cosas fáciles. Pentaho es un poco torpe. No me gusta en absoluto, pero podría. Me pareció que para ser demasiado complejo. Me gustaría que fuera más como el Cristal generador de informes o el MS generador de informes, pero es jasper gusta. Me parece que ser duro. Que puede ser una preferencia.

6.) ad hoc
MS - este fue el verdadero ganador para mí. He probado con mis usuarios, que al instante en el amor con el MS de usuario del generador de informes. Lo que hizo la diferencia fue la forma como fue no sólo es fácil de usar, sino también productivo. Pentaho - es buena, pero muy de la vieja escuela. Utiliza el más típico asistente basado en modelo y cuenta con potentes herramientas, pero la odio. Es una herramienta excelente para lo que es, pero se ha pasado de este estilo y nadie quiere volver. Mismo problema que yo tenía con logiXML. La interfaz trabajado bien para lo que era, pero realmente no es mucho de un cambio de lo que hemos utilizado de 12 años. http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

Hay algunas personas experimentadas por ahí que puede hacer Pentaho realmente funcionan bien, acabo de encontrar la MS suite para ser más productivo.

8voto

alchemical Puntos 4456

Advertencia-hay muchos sitios por ahí listado de las numerosas deficiencias, errores y molestias con SSIS. No sé por qué SSIS salió en la parte superior con el post, pero antes de apostar su proyecto en él, mira lo que la gente tiene que decir en la blogosfera. Desde mi experiencia a su alrededor de 20:1 despotricar sobre lo horrible de SSIS es colaborar con ... puedo concurrir así, en la actualidad, para cualquier alternativa.

7voto

Lee Puntos 71

Gran información aquí? No he probado Pentaho pero y planificación en echarle un vistazo. Soy un experimentado MS BI consultor, usando desde 1998. SSIS es muy rápido y muy potente, pero las críticas están a punto. He encontrado los siguientes problemas con SSIS:

(1) es difícil de depuración, se obtiene críptico errores que no te puede dar ninguna pista acerca de qué es y de dónde es realmente el problema.

(2) Por un anterior comentario, es el shittiest entorno de desarrollo nunca! No tengo ni idea de lo que están pensando.

(a) Crear una tabla con 100 o más columnas y poner una combinación de mezcla en él. Ahora volver y tratar de hacer una actualización a la combinación de mezcla (como tirar de una nueva columna a través de). Puede tomar varios minutos, incluso en el más rápido de la máquina después de hacer clic en aceptar en la combinación de mezcla para guardar el cambio. Tengo un enorme flujo de datos con un montón de distintos registros y muchas combinaciones de mezcla. Agregar una columna para el flujo de datos se lleva más de la mitad de un día. Puedo actualizar una combinación de mezcla y luego tener que ir a hacer algo más y comprobar de nuevo 5-10 minutos más tarde para ver si está hecha. Microsoft, la respuesta a esto es romper el paquete en varios paquetes, colocar los datos en una tabla o binario entre ellos. Así que si usted va a la disco entre todos los pasos, quizás fue bien la cosa entera en SQL! Uno de los propósitos principales de una herramienta ETL es todas estas cosas en la memoria y evitar el disco I/O.

(b) El diseñador de plano se bloquea a veces, perder todo su trabajo desde el pasado guardar (tengo que hacer ctrl-S en mi sueño ahora, porque de esto)

(c) yo tenía que encontrar un hack y generar paquete SSIS XML en Excel para distintos registros. Tengo una Salud de cliente donde 600+ columna registros son comunes. Si se intenta definir un formato de archivo con 600 columnas en SSIS, usted tendrá que escribir cada columna de a uno por vez!!! Incluso MS access permite cortar y pegar un diseño de una hoja de cálculo en un archivo de diseño, pero no de SSIS. Así que tuve que generar el XML del layout y pegar el código XML en el lugar correcto en el paquete. Fea manera de hacerlo, pero no salvó a todo el días de trabajo y un montón de errores.

(d) Similar a (c), si usted necesita para recortar todas sus columnas y digamos usted tiene más de 600 de ellos, ¿adivinen qué? En la columna derivada componente, para el tipo de recorte(columna1) 600+ veces! Ahora hago todo simple se transforma así en la consulta SQL para obtener los datos, ya que puede fácilmente ser generado a partir de una hoja de Excel.

(e) Hay muchos peculiar de las cosas, los componentes que se tornan invisibles, a veces de abrir el paquete y todos los componentes son completamente re-organizó incoherentemente.

(f) El FTP característica, posiblemente una de las cosas más comunes que usted necesita en ETL, es débil y sólo admite plain vanilla FTP que nadie usa. Todo el mundo en estos días los usos SFTP, FTPS, https, etc... por Lo que casi cada aplicación requiere el uso de una 3ª parte de elogiar impulsada por línea de transferencia de archivo de aplicación el paquete tiene que llamar.

(g) Tratando de CYA, similar a lo ridículo de seguridad en Windows Vista, Microsoft ha hecho que sea muy difícil, de hecho, promover un paquete SSIS de un entorno a otro. El valor predeterminado es esta cosa estúpida de "cifrado de información sensible del usuario, con clave de seguridad" lo que significa que se debe ejecutar en la misma cuenta en el entorno en el que se están moviendo a como el entorno en el que se desarrolló, algo que rara vez es el caso. Hay mejores maneras de configurar, pero siempre tratar de revertir esta completamente inútil la protección de seguridad.

(h) por último, la mayoría de estos problemas se encuentran ahora en que la 3ª versión, indicando claramente Microsoft no tiene planes para solucionarlos.

(i) la Depuración no es tan fácil como en otros idiomas.

SSIS todavía tiene una gran cantidad de beneficios, pero no sin algunos problemas graves de dolor.

4voto

Gary Brunton Puntos 629

Empecé a usar MS Reporting Services hace muchos años y le encanta. No lo he probado Penaho la solución de generación de informes, así que no puedo comentar sobre el mismo. Tampoco he probado ninguno de los dos Servicios de Análisis o Pentaho alternativa.

Recientemente tuve una solución ETL y estar familiarizado con MSSQL y MSRS parecía obvio que iba a revisar y probablemente elija MS Servicio de Integración. Pero para mí, MSI fue horrible. Sobre todo porque no es intuitivo. Después de pasar un par de días tratando de aprender la herramienta que me decidí a buscar una alternativa y llegó a través de Pentaho Data Integration, anteriormente conocido como Hervidor de agua. Yo lo tenía en marcha y funcionando en cuestión de minutos y de inmediato creado mi primera transformación. Simplemente funciona.

Es cierto que mis necesidades son bastante simple, pero el rendimiento ha sido excelente y la comunidad parece muy útil.

4voto

geoffrobinson Puntos 845

He utilizado SSIS y Pentaho Kettle, y yo recomiendo el uso de Pentaho Kettle para su herramienta ETL en lugar de SSIS.

Mis razones: -el flujo de SSIS es una tarea a otra. Hervidor de agua te hace pensar acerca de filas de datos que fluyen a través del sistema. Hervidor de enfoque parece mucho más intuitivo para mí. -SSIS está mal documentada. Esto sucede. Pero parece ser que hay una gran cantidad de rincón y grieta de hacer clic y el ajuste de las variables. Muy complejo. Pentaho tiene un foro de la comunidad que es muy útil. -Confío en Pentaho para integrarse con múltiples tipos de bases de datos, como SQL Server. También puede utilizar JDBC que es agradable. También lo he utilizado para ir entre SQL Server y Oracle en un lado y Vertica en el otro. Tiene un cargador masivo en Vertica. Que es muy agradable. -Lo he encontrado muy, muy duro relativamente hablando para obtener un paquete de SSIS para ejecutarse en un servidor. No vale la pena mi tiempo. -Me pareció bastante fácil de Pentaho para enviar por correo una advertencia o mensaje de error a una persona o una lista de la gente. -Pentaho permite que las tareas se hace en JavaScript para cosas que necesitan un poco de lógica. Simple y fácil de hacer con un lenguaje que la mayoría de nosotros nos han llegado a través de.

Iteramos.com

Iteramos es una comunidad de desarrolladores que busca expandir el conocimiento de la programación mas allá del inglés.
Tenemos una gran cantidad de contenido, y también puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X