El estudio del origen de la vida y la naturaleza de la información biológica ha sido objeto de interés desde hace décadas, planteando preguntas profundas sobre cómo entidades químicas simples pueden asumirse como portadoras de información y significado. La visión tradicional centrada en el ADN y el ARN como portadores de información genética ha sido cuestionada por nuevas perspectivas que proponen que la significación biológica emerge en un contexto de interpretación molecular, más que en propiedades inherentes a las propias moléculas. Una de las ideas fundamentales es que no son las moléculas en sí mismas las que contienen información, sino que las características estructurales de moléculas como el ADN y el ARN actúan como artefactos semióticos, lo que significa que ofrecen oportunidades o pistas que un sistema interpretativo bioquímico puede aprovechar para mantener procesos funcionales. En lugar de tratar estas moléculas como fuentes originales de información, se entiende que ellas proporcionan las bases materiales sobre las cuales los sistemas vivos, particularmente virus y células, llevan a cabo dinámicas interpretativas que las convierten en señales. El reconocimiento de las señales biológicas depende de un sistema que pueda interpretarlas de manera coherente y con competencia interpretativa.
Así, la centralidad del proceso interpretativo es esencial para entender cómo un objeto físico puede ser “acerca de” otra cosa, es decir, cómo se construye significado en la biología. Esta idea implica un cambio conceptual: la información biológica no puede reducirse solo a patrones copiados como en la perspectiva clásica de replicación, sino que debe incluir la capacidad de un sistema para interpretar y responder a signos. En los estudios pioneros, Erwin Schrödinger ya planteaba en 1944 la paradoja de cómo los organismos podían mantener un estado ordenado lejos del equilibrio termodinámico y al mismo tiempo almacenar y transmitir información vital. Más tarde, Crick con su dogma central postuló que la información genética fluye del ADN al ARN para sintetizar proteínas, consolidando la visión de las moléculas como portadoras de información. Sin embargo, esta perspectiva tiende a simplificar la complejidad semiótica involucrada y no explica adecuadamente cómo la información adquiere significado y función.
El matemático Claude Shannon aportó una teoría fundamental sobre la transmisión de información, enfocándose en la reproducción de mensajes de un punto a otro y desligando esta transmisión del contenido semántico. En la práctica, esta teoría nos ayuda a entender la comunicación biológica desde el punto de vista de la transmisión mecánica de señales pero no aborda la interpretación ni el propósito detrás de ellas, aspectos cruciales para comprender la vida. El reto entonces es determinar qué procesos moleculares pueden interpretar propiedades de una molécula como información sobre otras moléculas o condiciones ambientales. Se ha propuesto un modelo alternativo basado en procesos moleculares sencillos que no requieren asumir propiedades no explicadas, respaldados únicamente por física y química conocidas. Un ejemplo ilustrativo es el de un virus autogénico hipotético (llamado autógeno), que combina dos procesos clave: la catálisis recíproca y el autoensamblaje molecular.
La catálisis recíproca consiste en un ciclo en que un producto cataliza la formación del siguiente, que a su vez cataliza el anterior, creando una red circular de reacciones. El autoensamblaje, por otro lado, es la capacidad de ciertos componentes moleculares, como proteínas de cápsides virales, para organizarse espontáneamente en estructuras cerradas y ordenadas, como cápsides poliédricas o tubulares. Cuando estos dos procesos están acoplados, la catálisis promueve la producción de moléculas que se ensamblan en cápsides, mientras que el autoensamblaje genera límites que mantienen juntos los catalizadores necesarios para las reacciones recíprocas. Este acoplamiento permite que el sistema se autorepare y reproduzca, dando lugar a un ciclo de trabajo autogénico que mantiene el sistema lejos del equilibrio termodinámico y activo a pesar de los daños o fluctuaciones externas. Este modelo pone en evidencia propiedades emergentes que no se reducen a las características físicas de las moléculas por separado, tales como la individuación, la autonomía, el mantenimiento recursivo, la normatividad y la competencia interpretativa mínima, que es la capacidad para diferenciar entre sí mismo y el entorno.
En términos semióticos, esto equivale a una interpretación básica icónica, donde cualquier perturbación es tratada como signo de alteración o daño y el proceso que restaura el sistema es la interpretación que promueve la autorregeneración. A partir de este modelo básico, se pueden derivar interpretaciones más complejas. Por ejemplo, un autógeno que presenta estructuras en su cápside sensibles a la concentración de sustratos externos, que afectan su fragilidad y la probabilidad de liberar catalizadores en condiciones favorables, ofrece un ejemplo simple de interpretación indexical, donde un cambio en la cápside es signo de un estado ambiental relevante para la autoreparación y reproducción. Un paso más en esta dirección es la incorporación de moléculas portadoras de energía, como nucleótidos con enlaces pirofosfato de alta energía (por ejemplo ATP o GDP), lo que podría facilitar una autogénesis asistida energéticamente, ampliando el rango de sustratos y reacciones útiles. Para evitar que estos compuestos en fase inerte causen daños, la evolución potencialmente exaptó su incorporación en polímeros no reactivos como el ARN y el ADN, que almacenan esta energía de forma segura y permiten su uso controlado durante las fases dinámicas.
La transición hacia la función informativa de estos polímeros se explica por su capacidad para servir como plantillas que alinean catalizadores basándose en complementariedades estructurales. Esta organización secuencial reduce la complejidad de las interacciones moleculares, permitiendo que ciertas secuencias de nucleótidos favorezcan un conjunto coordinado y selectivo de reacciones catalíticas. Así, los polímeros actúan como estructuras que “offload” o descargan parte de las restricciones dinámicas del sistema en una forma estable y replicable. De esta manera, la información molecular no reside únicamente en la secuencia química sino en la relación funcional entre esa secuencia y los procesos catalíticos que regula. Se produce una relación simbólica rudimentaria donde el molde (nucleótido-polímero) se convierte en un signo que representa y determina la dinámica química, constituyendo un caso primigenio de semiosis molecular, entendida aquí como el proceso de significación y representación en términos bioquímicos.
Este mecanismo es análogo a niveles superiores de semiosis, como el código genético en células vivas, donde la correspondencia entre secuencias de nucleótidos y secuencias de aminoácidos, mediada por adaptadores como el ARN de transferencia, crea un sistema altamente predispuesto a la producción de proteínas específicas. Este sistema representa un nivel avanzado de semiotic scaffolding o andamiaje semiótico, donde la información se transfiere y regula a múltiples niveles, desde la molecular hasta la celula, tejidos y organismos. El andamiaje semiótico implica que los procesos interpretativos emergen jerárquicamente y se apoyan mutuamente. Las estructuras moleculares y sus interacciones proporcionan las base para interpretaciones más complejas, que permiten sistemas autoregulados y adaptativos con capacidad de evolución abierta. La duplicación y variación genética de genes reguladores, por ejemplo, permite la evolución de formas corporales complejas y diversificadas, demostrando cómo la semiosis molecular tiene implicaciones macroscopicas.
Esta visión amplia del origen de la información biológica desafía el paradigma convencional que prioriza la replicación molecular como la base fundamental de la vida. En cambio, destaca la importancia de procesos interpretativos autogénicos y sistemas de representación recursiva como origen de la información funcional. Por lo tanto, moléculas como el ADN y ARN no son por sí mismas la información, sino estructuras semióticas que emergen de y permiten la dinámica interpretativa molecular compleja. Comprender cómo las moléculas se convirtieron en signos abre nuevas perspectivas para estudiar la vida, su origen y evolución. Sugiere explorar cómo los sistemas moleculares pueden adquirir y desarrollar competencias interpretativas que dan lugar a la significación semiótica y, en última instancia, a los procesos cognitivos.
Esta aproximación interdisciplinares, que combina semicología, biología molecular, termodinámica y teoría de sistemas, ofrece una ruta prometedora para resolver cuestiones fundamentales sobre qué es la vida y cómo la información adquiere significado y función en los sistemas vivos.