Análisis del system prompt de Claude 4 (Sonnet)

Gráfico técnico con elementos visuales del prompt de Claude 4: ética, habilidades, estilo, seguridad y búsqueda web

Análisis detallado del system prompt de Claude 4 (Sonnet) basado en el archivo filtrado y almacenado en el perfil público de CL4R1T4S en GitHub, organizado en secciones clave:


1. Identificación y contexto

  • Modelo: Claude Sonnet 4 (parte de la familia Claude 4, junto a Claude Opus 4).
  • Fecha de conocimiento: Enero 2025 (con capacidad de búsqueda web para información posterior a esa fecha).
  • Productos asociados:
    • API (claude-sonnet-4-20250514).
    • Claude Code: Herramienta de terminal en fase de investigación para delegar tareas de código.

2. Principios éticos y restricciones

Seguridad y prevención de daños

  • Contenido peligroso:
    • Rechaza generar información sobre armas químicas/biológicas, malware, autolesiones, o grooming infantil.
    • Evita facilitar acceso a fuentes extremistas o discursos de odio.
  • Derechos de autor:
    • No reproduce contenido protegido (ej: canciones, artículos completos). Solo cita fragmentos de menos de 15 palabras y siempre entre comillas.
    • No genera resúmenes «desplazantes» (que reemplacen el original).

Interacciones con usuarios

  • Salud mental: Ofrece apoyo emocional, pero evita reforzar conductas autodestructivas.
  • Menores: Bloquea contenido que pueda sexualizar o poner en riesgo a menores de 18 años.
  • Neutralidad: referida a que:
    • No emite juicios morales:
      • No asume una postura de «bien» o «mal» sobre temas subjetivos o controvertidos (como política, religión, preferencias personales, etc.).
      • Evita frases como «Eso está mal», «No deberías…» o «Es inmoral».
    • Redirije solicitudes poco éticas:
      • Si una petición va en contra de políticas éticas (por ejemplo, generar contenido dañino, ilegal o engañoso), no la cumple.
      • En lugar de dar una explicación detallada (que podría usarse para manipular o insistir), responde de manera breve y neutral, como: «No puedo ayudar con eso» o «Prefiero no continuar con este tema».
    • Ejemplo:
      • Usuario: «¿Cómo puedo hackear una cuenta de alguien?»
      • Respuesta neutral: «No puedo ayudarte con eso.» (Sin justificaciones o debates).
      • Esta política busca equilibrio: ser útil sin avalar acciones cuestionables, manteniendo interacciones seguras y profesionales. ¿Hay algo más que te gustaría aclarar?

3. Habilidades técnicas

Búsqueda web y herramientas

  • Estrategia de búsqueda:
    • Sin búsqueda: Para información estable (ej: capitales, teorías científicas).
    • Búsqueda única: Datos actualizados (ej: clima, resultados electorales).
    • Investigación profunda (2-20 búsquedas): Análisis comparativos o informes complejos.
  • Citas: Siempre atribuye fuentes con etiquetas <cite> y evita reproducir texto protegido.

Artifacts (Generación de contenido)

  • Tipos soportados:
    • Código (application/vnd.ant.code), Markdown (text/markdown), HTML/JS/CSS (text/html), SVG, diagramas Mermaid.
    • React: Usa Tailwind CSS, hooks (useState), y librerías preinstaladas (ej: Three.js, D3.js).
  • Restricciones:
    • No usa localStorage: Almacenamiento solo en memoria.
  • Accesibilidad: Diseños responsivos, contraste adecuado, HTML semántico.

Análisis de datos

  • Herramienta REPL: Ejecuta JavaScript para:
    • Cálculos complejos (ej: interés compuesto, raíces grandes).
    • Procesar archivos grandes (CSV, Excel) con PapaParse o SheetJS.
  • No usar para código en otros lenguajes (solo JS).

4. Estilo de Comunicación

  • Tono:
    • Conversacional: Natural y empático en diálogos casuales.
    • Técnico: Directo y estructurado en respuestas complejas (sin listas a menos que se soliciten).
  • Formatos:
    • Prosa para informes técnicos (evita viñetas).
    • Listas Markdown solo cuando el usuario las pida.
  • Errores: Revisa críticas de usuarios antes de admitir fallos (ellos también pueden equivocarse).

5. Manejo de información

  • Memoria: No retiene datos entre chats. Informa al usuario si pregunta por experiencias previas.
  • Actualizaciones: Usa búsqueda web para eventos posteriores a enero 2025 (ej: elecciones de noviembre 2024).
  • Ubicación: Asume Países Bajos (NL) para consultas geográficas, pero no lo menciona explícitamente.

6. Ejemplos prácticos

Caso 1: Solicitud de código

# Ejemplo de cómo Claude generaría un script Python (sin usar REPL)
def factorial(n):
    """Calcula el factorial de un número."""
    return 1 if n == 0 else n * factorial(n-1)

Comentarios: Cada línea tiene una explicación clara.

Caso 2: Búsqueda Web

Usuario: «¿Quién ganó las elecciones en México en 2024?»

Respuesta de Claude:

  1. Busca automáticamente (fuente confiable como .gob.mx).
  2. Responde: «Según los resultados oficiales, [candidato] ganó las elecciones presidenciales de 2024.» <cite doc_index=0, sentence_index=1>.

Caso 3: Artefacto HTML

<!-- Ejemplo de componente React con Tailwind -->
<div className="bg-blue-100 p-4 rounded-lg">
  <h2 className="text-xl font-bold">¡Hola!</h2>
</div>

Características: Diseño responsive, sin localStorage.


7. Diferencias con otros LLMs

AspectoClaude 4GPT-4Gemini
ÉticaRechazo explícito a violar derechos de autorMás flexible con citasSimilar, pero menos rígido
Búsqueda webEscalable (1-20 búsquedas según complejidad)Búsqueda única o limitadaMultimodal (imágenes/texto)
EstiloProsa técnica sin listas innecesariasMás conversacionalAltamente estructurado

8. Consejos para un prompting más efectivo

Sé específico:

«Genera un informe de 3 párrafos sobre energías renovables en Europa, citando 2 fuentes web recientes.»

Usa ejemplos:

«Como este poema: [ejemplo], escribe uno similar sobre el mar.»

Solicita formatos:

«Responde en una tabla Markdown con ventajas/desventajas.»


Conclusión

Claude 4 prioriza seguridad, precisión técnica y respeto a derechos de autor, con un equilibrio entre empatía en conversaciones y rigor en respuestas técnicas. Su capacidad de búsqueda escalable y generación de artefactos funcionales lo hacen ideal para tareas complejas, aunque con menos flexibilidad creativa que otros modelos en contenido protegido.

Scroll al inicio