|

Convierte HDS a JSON en segundos – API automatizada

TurnInto es una API que convierte hojas de seguridad química (SDS/MSDS) en PDF a JSON estructurado, parseando automáticamente las 16 secciones del estándar GHS. El modelo es pago por uso sin suscripción, los primeros 20 documentos son gratis y no necesitás tarjeta de crédito. La integración toma minutos si ya manejás APIs REST.

En 30 segundos

  • TurnInto extrae datos de fichas de seguridad PDF y los convierte a JSON con las 16 secciones GHS parseadas.
  • Primeros 20 documentos gratis, sin tarjeta de crédito, modelo pago por uso.
  • Soporta PDF de texto (no escaneos), máximo 10 MB por archivo.
  • Extrae CAS, hazard statements, requisitos de PPE y propiedades químicas listos para integrar en tu DB.
  • Ventajas: automatización de inventario, cumplimiento regulatorio (REACH, SGA en Argentina), búsqueda rápida de sustancias.

Una hoja de seguridad (ficha de datos de seguridad o SDS por sus siglas en inglés) es un documento que lista información sobre sustancias químicas, incluyendo peligros, medidas de primeros auxilios, propiedades físicas y requisitos de manejo. TurnInto es una herramienta que automatiza la lectura de estos PDFs y los convierte en datos estructurados en formato JSON, listos para integrar en sistemas.

Qué es TurnInto y por qué necesitas automatizar SDS

Ponele que laburas en una farmacéutica y manejás 500 ingredientes diferentes. Cada uno tiene su ficha de seguridad en PDF, descargada de 50 proveedores distintos, con formatos que varían de un lado a otro. Alguien entra a tu base de datos de inventario, busca el CAS del paracetamol y encuentra nada, porque los números no están centralizados sino enterrados en 500 PDFs (y si es que el PDF está actualizado, porque medio que no). Acá es donde entra TurnInto. La herramienta toma ese PDF, detecta si es una hoja de seguridad antigua (MSDS) o nueva (SDS con formato GHS), extrae automáticamente todas las secciones obligatorias del estándar global, valida que la estructura sea correcta, y te devuelve un JSON limpio. Después integrás eso en tu sistema de inventario, de cumplimiento regulatorio, o del que sea que uses.

El formato JSON es lo importante acá. Un JSON structurado significa que después podés hacer queries tipo “dame todas las sustancias que requieren Clase A de PPE” o “cuáles tienen CAS que coincidan con nuestro inventario” sin depender de que alguien lea cada PDF a mano (que, dicho sea de paso, es donde pasan los errores).

Cómo funciona la extracción automática de datos SDS

El flujo es más o menos así: suben el PDF (máximo 10 MB, tiene que ser texto, no escaneo), TurnInto analiza la estructura, identifica las secciones —que en SDS GHS estándar son siempre las mismas 16— extrae el contenido de cada una, lo valida contra el schema esperado, y devuelve un JSON con toda la información parseada.

Según la documentación de TurnInto, la API espera un POST a https://turninto.dev/api/extract con autorización Bearer token y el archivo PDF. Devuelve en la respuesta un objeto JSON con todas las secciones como propiedades anidadas. Si pasa algo (PDF escaneo, formato corrupto, más de 10 MB), la API devuelve un error específico que te dice qué falló.

El factor tiempo: la primera extracción tarda alrededor de 40-50 segundos si el servidor está frío. Las siguientes son más rápidas porque TurnInto cachea modelos internamente. Lo explicamos a fondo en procesar datos sin conexiones externas.

Las 16 secciones GHS y cómo se mapean a JSON

El estándar GHS (Globally Harmonized System) define 16 secciones obligatorias en toda hoja de seguridad moderna. Cuando TurnInto parsea un SDS, extrae cada una como un campo del JSON:

  • 1. Identificación: Nombre del producto, número CAS, usos, proveedor, teléfono de emergencia.
  • 2. Identificación del peligro: Clasificación GHS, pictogramas, palabras clave (Peligro/Advertencia).
  • 3. Composición / Información sobre los componentes: Ingredientes, porcentajes, números CAS.
  • 4-8. Medidas de primeros auxilios, medidas contra incendios, medidas contra derrame, manipulación y almacenamiento, exposición y protección personal: PPE (guantes, gafas, respiradores), controles de ingeniería.
  • 9-13. Propiedades físico-químicas, estabilidad, toxicología, ecología, consideraciones de eliminación: Punto de ebullición, pH, LD50 (toxicidad), biodegradabilidad.
  • 14-16. Información sobre transporte, información regulatoria, otra información: Clasificación ONU, normativas locales (REACH en EU, SGA en Argentina).

Cuando recibís el JSON de TurnInto, cada sección llega como un objeto con sus propiedades anidadas. Significa que en tu código podés acceder directo a datos como json['seccion_3']['ingredientes'] o json['seccion_4']['ppe_requerido'] sin parsear texto libre.

Ventajas de convertir SDS a JSON: por qué importa para tu empresa

Automatización del inventario químico. En vez de que alguien abra cada PDF, copie datos a mano y meta errores tipográficos, el JSON se auto-valida. Si hay un CAS que no encaja, el schema lo rechaza.

Integración con sistemas EHS (Environmental, Health and Safety) y CMMS (Computerized Maintenance Management Systems). Tus herramientas de cumplimiento regulatorio hablan JSON. Un SDS que llega como JSON se mapea directo a la DB; uno que llega como PDF es trabajo manual.

Cumplimiento regulatorio. En Argentina, el SGA (Sistema Globalmente Armonizado) obliga a las empresas a mantener fichas actualizadas en español. En Europa, REACH requiere datos estructurados sobre sustancias químicas. Si tu auditoría pide “dame un CSV con todas las sustancias peligrosas clasificadas por riesgo reproductivo”, con JSON lo hacés en un query. Con PDFs manuales, contratas a alguien durante dos semanas.

Búsqueda rápida de CAS. Necesitás verificar si una sustancia que comprás nueva está en tu inventario. Con JSON queryable, es milisegundos. Con PDF, es abrir 50 archivos.

Auditoría y versionado. Cada extracción lleva timestamp. Si después la regulación cambia o el proveedor actualiza el SDS, tenés registro de cuándo fue la última versión que procesaste. Esto se conecta con lo que analizamos en proteger información sensible correctamente.

Casos de uso: farmacia, química, manufactura

Farmacéuticas e industria de aditivos alimentarios: Manejan cientos de ingredientes, cada uno regulado, cada uno con SDS que debe estar accesible para auditoría. TurnInto permite centralizar esos datos en una tabla SQLite o PostgreSQL, searchable en segundos.

Laboratorios químicos y distribuidores: CIQUIME en Argentina agrupa laboratorios químicos donde la trazabilidad es crítica. Un distribuidor que maneja 1000 SKUs químicos diferentes puede usar TurnInto para automatizar el onboarding de nuevos productos del proveedor.

Hospitales con farmacias: Las drogas que maneja un hospital son peligrosas. La farmacéutica necesita SDS accesibles para el personal de emergencia. Un JSON quiere decir que la data es queryable desde cualquier terminal, en cualquier momento.

Manufactura de alimentos: Si producís bebidas, condimentos o aditivos, necesitás rastrear el CAS de cada componente que entra. TurnInto parsea eso automáticamente cuando llega el SDS del proveedor.

Comparativa de soluciones: TurnInto vs alternativas

SoluciónModelo de precioFormatos soportadosIdiomasIntegracionesTiempo respuestaObservaciones
TurnIntoPago por uso, primeros 20 gratis, sin tarjetaPDF textoMúltiples (GHS es global)API REST simple40-50 seg (primera), más rápido despuésInterfaz simple, bueno para MVP, no requiere setup
SDS Manager (SDSManager)Suscripción + por documentoPDF, Word, ExcelMúltiplesSOAP, RESTVariableMás empresarial, soporte dedicado
ChemParserSuscripción mensualPDF, escaneos (OCR)MúltiplesAPI + Dashboard webVariableManeja escaneos, overhead de costo
CloudSDSSuscripciónPDFMúltiplesREST, webhooksVariableCloud-native, escalable para volumen alto
convertir hds a json diagrama explicativo

TurnInto gana si recién estás empezando o no tenés volumen alto. Sin suscripción mínima, sin tarjeta desde el día 1, y la interfaz web es directa: arrastrás un PDF y lo extraés al JSON. Si después necesitás procesar 10000 documentos/mes, probablemente CloudSDS o ChemParser sean más eficientes en costo por documento.

Cómo integrar una API SDS en tu flujo de trabajo actual

Primero, agarrás tu API key de TurnInto (sin tarjeta, 20 documentos gratis). Después, en tu código (Python, Node, Go, lo que uses), hacés un POST simple:

En Python sería algo como:

import requests files = {'file': open('safety-data-sheet.pdf', 'rb')} headers = {'Authorization': 'Bearer YOUR_API_KEY'} response = requests.post('https://turninto.dev/api/extract', files=files, headers=headers) data = response.json() # Ya tenes el JSON parseado

Después mapeás los campos a tu base de datos. Si usás PostgreSQL, una tabla simple sería: Complementá con automatizar tareas con inteligencia artificial.

CREATE TABLE sds_chemicals ( id SERIAL, product_name VARCHAR, cas_number VARCHAR, ghs_classification JSONB, ppe_required JSONB, hazard_statements TEXT, extracted_at TIMESTAMP );

El JSON que devuelve TurnInto lo insertás directo en las columnas JSONB, y después podés queryar: SELECT * FROM sds_chemicals WHERE ghs_classification ->> 'acute_toxicity' = 'Category 3';

Manejo de errores: si mandás un PDF escaneado (no texto), la API rechaza con error 400. Si el archivo es más de 10 MB, idem. Vos atrapás esos errores y avisás al usuario que suba un PDF texto válido.

Qué está confirmado / Qué no

Confirmado:

  • TurnInto parsea las 16 secciones GHS estándar según la documentación oficial.
  • Primeros 20 documentos gratis, sin tarjeta requerida.
  • API REST con autenticación Bearer token.
  • Soporta máximo 10 MB por archivo, PDF texto solamente.
  • Modelo pago por uso (precio no anunciado públicamente en versión early access).
  • La interface web funciona para pruebas rápidas de PDFs.

Pendiente de confirmar (a partir de abril 2026):

  • Soporte para idiomas locales (español, portugués) en el parsing. GHS es estándar global, pero los PDFs en español podrían tener variaciones regionales.
  • SLA (Service Level Agreement) para producción y uptime garantizado.
  • Integración directa con sistemas EHS conocidos (Intelex, Enablon, Velocity).
  • Soporte para escaneos con OCR (ChemParser sí, TurnInto no, al menos por ahora).

Errores comunes

Subir un PDF escaneo esperando que TurnInto lo procese: No. TurnInto parsea texto PDF, no imagenes. Si tu SDS es un escaneo JPG disfrazado de PDF, falla con error 400. Si necesitás OCR, usá ChemParser. La solución: asegurate que el PDF sea generado desde texto, no fotografía escaneada.

Asumir que el JSON está listo para usar directo en tu DB sin validación: El JSON que devuelve TurnInto está bien estructurado, pero si el SDS original tenía datos missing (secciones vacías, campos en blanco), el JSON también. No asumas que json['seccion_2']['hazard_classification'] existe. Validá schema antes de insertar en tu base de datos. La solución: escribe un validator JSON que verifique que cada campo requerido esté presente.

No monitorear cuota ni costos en producción: Aunque los primeros 20 son gratis, después es pago por uso. Si tu script corre sin límite, puede procesar 10000 documentos en una noche y costarte. La solución: loguea cada request a TurnInto, monitoreá cuota, y si estás cerca del límite que esperabas, pausá o alertá. Para más detalles técnicos, mirá dónde alojar tu código fuente.

Preguntas Frecuentes

¿Cómo diferencia TurnInto entre SDS antiguo (MSDS) y nuevo (SDS GHS)?

TurnInto lo detecta automáticamente mirando la estructura del PDF y la presencia de campos GHS estándar (secciones numeradas 1-16, pictogramas, palabras clave como “Peligro”). Si es MSDS antiguo (estructura diferente, menos secciones), lo parsea lo mejor que puede pero advierte que el mapping puede no ser perfecto.

¿Qué pasa si el SDS está en idioma local, no en inglés?

TurnInto parsea la estructura independientemente del idioma. Si el PDF está en español, français o alemán, el contenido del JSON llega en ese idioma. Lo que sí es que el nombre de las secciones (keys del JSON) probablemente vuelvan en inglés. Si necesitás traducción de contenido, eso es paso aparte.

¿Cuánto cuesta procesar 1000 documentos al mes?

TurnInto no publicó los precios finales en abril de 2026 (aún está en early access). Tenés 20 gratis para probar. Para volumen alto, contactá al equipo de TurnInto para precio custom. Comparado con SDS Manager o CloudSDS que tienen suscripción fija, TurnInto probablemente sea más barato si tu volumen es bajo-medio.

¿TurnInto guarda mis PDFs o datos de mi empresa?

La documentación no especifica política de retención explícitamente. Si el dato es sensible, consultá con el equipo de TurnInto antes de subir. Mejor práctica: no subas PDFs con datos confidenciales de tu empresa sin antes leer su política de privacidad y confirmar que cumpla con tus requerimientos legales.

¿Qué hago si TurnInto falla y necesito procesar SDS urgentemente?

Tenés alternativas en paralelo. Si es un PDF pequeño, la interfaz web de TurnInto lo procesa en el navegador. Si necesitás fallback automático, integra dos APIs: llama TurnInto primero, y si falla después de N reintentos, usa ChemParser o SDS Manager. Esto es lo que hacen farmacéuticas grandes con datos críticos.

Conclusión

Convertir hojas de seguridad a JSON estructurado deja de ser un problema cuando tenés una herramienta como TurnInto. No es revolucionario, pero sí es práctico: automatizás lo que era manual, reducís errores, y cumplís regulaciones sin que alguien tenga que leer 500 PDFs a mano.

Si recién estás evaluando soluciones de automatización SDS, TurnInto vale la pena probar porque no necesitás tarjeta ni commit de dinero. Subís 20 PDFs gratis, ves si el JSON te sirve, y después decidís si escalás. Si ya manejás volumen alto, mirá CloudSDS o negocia custom con TurnInto.

Lo que no podés es seguir con PDFs dispersos y datos manuales. La auditoría te lo va a exigir tarde o temprano, y mejor estar preparado ahora que a los apurones cuando el regulador toque la puerta.

Fuentes

Similar Posts