¿Por qué la mentalidad del apostador finalmente pierde todo? Leyes de supervivencia en sistemas no iterativos

Autor: Snow Goose, DataCafe

Imagina que participas en un juego de desafío de lanzar monedas con un capital inicial de 1000 yuanes, y puedes elegir seguir jugando indefinidamente:

Lanzar una moneda una vez por ronda,

Lanzar al frente, la riqueza aumenta un 80%.

Al voltear, la riqueza disminuye un 50%.

¡Suena como un juego en el que siempre se gana!

Pero la realidad es...

Si dejas que 100,000 jugadores participen en este juego y les haces jugar 100 rondas cada uno, descubrirás que: su riqueza promedio efectivamente está creciendo exponencialmente, pero la gran mayoría de las personas termina con menos de 72 yuanes, ¡incluso en quiebra!

¿Por qué la riqueza promedio está creciendo, pero la mayoría de las personas se están volviendo cada vez más pobres?

Esta es una trampa no iterativa típica. Siempre pensamos que una ronda más podría cambiar las cosas, precisamente porque confundimos el promedio del grupo con el destino individual.

Trampas no iterativas: media a largo plazo ≠ tu verdadero destino

¿Qué es la traversabilidad?

El concepto de ergodicidad apareció por primera vez en la física estadística y ha tenido un profundo impacto en campos como la teoría de probabilidades, las finanzas, las ciencias del comportamiento y el aprendizaje automático. La pregunta central que intenta responder es: ¿el valor promedio a largo plazo se aplica a los individuos? Al tomar decisiones, ¿deberíamos confiar en el 'promedio a largo plazo' o en la realidad de 'las experiencias personales reiteradas'?

En el siglo XIX, el físico Ludwig Boltzmann propuso la hipótesis de la ergodicidad al estudiar el movimiento de las moléculas de gas: si se observa una molécula de gas el tiempo suficiente, recorrerá todos los estados posibles.

Imagina un recipiente de gas cerrado, en el que hay innumerables moléculas de gas, y cada molécula experimenta diferentes trayectorias de velocidad durante los choques. La trayectoria a largo plazo de una sola molécula y la distribución estadística de todo el gas son las mismas, lo que significa que podemos usar el estado de todas las moléculas en un momento dado para inferir la trayectoria a largo plazo de una sola molécula.

Esta es la famosa hipótesis de ergodicidad de Boltzmann.

En matemáticas, la recorribilidad significa:

A la izquierda está el promedio temporal: describe el resultado promedio obtenido por un individuo después de experimentar el mismo proceso múltiples veces durante un período de tiempo suficientemente largo.

A la derecha se encuentra el promedio del grupo: describe la expectativa estadística obtenida al observar innumerables individuos en un momento dado. En otras palabras: cuando el sistema cumple con las condiciones de ergodicidad, el rendimiento de un individuo finalmente convergerá con el "promedio a largo plazo" del grupo.

Si el mundo es ergódico, la riqueza de cada persona eventualmente se acercará al nivel promedio de riqueza de la sociedad. En un mundo ergódico, todos pueden experimentar todos los posibles estados económicos (riqueza, pobreza, éxito, fracaso), y el destino de los individuos siempre convergerá hacia el "promedio a largo plazo" del grupo.

Pero la vida real a menudo es no recorrible: los recursos de los individuos son limitados y, a menudo, se quedan fuera directamente debido a un fracaso antes de experimentar todos los caminos posibles.

A menudo escuchamos declaraciones orientadoras como estas:

"El ingreso anual promedio en cierta industria supera el millón."

"Alguien alcanzó la libertad financiera a los 30 años, y solo le tomó dos años emprender."

"Un fondo índice tiene un alto rendimiento anualizado a largo plazo, solo hay que seguir invirtiendo y se volverá rico."

……

Estas estadísticas que parecen razonables parecen contarnos una verdad definitiva. Como si solo se actuara, el rendimiento promedio a largo plazo se aplicaría a los individuos. Pero estos casos pertenecen a un proceso no exploratorio de dependencia de trayectoria + no replicable. Los imitadores no pueden experimentar el mismo contexto histórico, redes de relaciones, nodos de fortuna, e incluso no saben cuántos fracasados están ocultos.

Los datos te dicen el valor promedio a largo plazo de un grupo, pero la realidad está llena de fracasos "repentinos" a corto plazo.

Esta es precisamente la trampa más oculta de la no transitividad: el promedio de las estadísticas de grandes datos ≠ el destino real del individuo.

Un colapso puede ser irreparable para un individuo, un fracaso puede hacer que alguien quede totalmente fuera de juego, sin posibilidad de regresar al "estado promedio". Cada uno de nosotros solo puede experimentar una vez el camino de la vida, no podemos, como en un casino, beneficiarnos del promedio a largo plazo de un grupo, esperando que las probabilidades se promedien entre innumerables apostadores.

¿Por qué el destino a largo plazo de los individuos suele ser peor que la "media"?

En sistemas no iterativos, el desempeño a largo plazo de los individuos suele estar por debajo del promedio del grupo. No es una coincidencia, sino una característica estructural del sistema. Los brillantes promedios a menudo son elevados por las historias de unos pocos que han tenido éxito en sus emprendimientos, han enriquecido con inversiones o han logrado un cambio radical en su situación, mientras que los fracasos de muchas más personas nunca entran en las estadísticas.

Los sistemas reales en la mayoría de los casos son de tipo multiplicativo y tienen características de dependencia de trayectoria: por ejemplo, el interés compuesto de las inversiones, el deterioro de la salud, la destrucción de la reputación. Las características típicas de este tipo de sistemas son: limitaciones en el ascenso y una caída sin fondo.

Una quiebra puede arruinar una vida;

Una sola decisión errónea puede cambiar por completo el destino;

Una falta de confianza puede destruir completamente la confianza;

Sin embargo, la riqueza que se puede ganar, el rendimiento que se puede aumentar y las ventajas que se pueden establecer siempre son limitados.

Esta es la razón por la cual, en matemáticas, la tasa de crecimiento a largo plazo de un proceso multiplicativo no es igual al "rendimiento promedio", sino que se acerca más a:

En comparación, el promedio de grupo generalmente se calcula utilizando el promedio aritmético,

Y dado que la función logarítmica es una función cóncava estricta, basado en la desigualdad de Jensen, se tiene que:

Por lo tanto, la tasa de crecimiento a largo plazo del sistema multiplicativo (es decir, la media geométrica) siempre es menor que la media aritmética. Cuanto mayor es la volatilidad, más evidente es esta diferencia. La media aritmética te dice 'cómo sería si siempre tuvieras suerte', mientras que la media geométrica te dice 'cuánto te queda después de haber pasado por las tormentas del mundo real.'

Esto significa que el rendimiento a largo plazo de los individuos siempre está muy por debajo del "rendimiento promedio del grupo", no es por mala suerte, sino por la estructura.

¿Cómo tomar decisiones óptimas? La línea de oro de la fórmula de Kelly

Entonces, en la toma de decisiones de vida, ¿qué podemos hacer para evitar el destino de quedarnos en cero en un juego a largo plazo? ¿Cómo podemos salir sin quebrar y al mismo tiempo lograr un interés compuesto a largo plazo?

La respuesta es: ¡Nunca hagas All in, aprende a apostar con la fórmula de Kelly!

La fórmula de Kelly (Criterio de Kelly) es una estrategia óptima de apuesta utilizada en juegos repetidos, cuyo objetivo es maximizar los rendimientos a largo plazo mientras se evita la quiebra a corto plazo. Fue propuesta originalmente por John L. Kelly Jr. en 1956 en los Laboratorios Bell, con la intención de resolver "cómo distribuir la potencia de la señal en un canal ruidoso" para maximizar la eficiencia de la transmisión de información.

Pronto, esta teoría cruzó fronteras y se hizo conocida.

El matemático estadounidense y genio de las inversiones Edward Thorp descubrió que la fórmula de Kelly puede optimizar el camino del crecimiento de la riqueza. La llevó a los casinos y en "Beat the Dealer" fue la primera vez que la utilizó sistemáticamente para vencer al croupier del blackjack, y luego la llevó a Wall Street, donde continuó "cosechando" en "Beat the Market".

Esta norma es esencialmente equivalente a maximizar el logaritmo de la utilidad esperada (log-utility), lo que permite mantener un equilibrio dinámico entre el crecimiento y el riesgo. Te ayuda a encontrar un punto de equilibrio óptimo entre "vivir mucho tiempo" y "ganar lo suficiente".

Fórmula de Kelly:

En este caso, la probabilidad de éxito es p, la probabilidad de fracaso es q = 1-p; el múltiplo de ganancia en caso de éxito (sin incluir el capital) es b, y la proporción de pérdida en caso de fracaso es a (normalmente es 1, si se pierde la totalidad del monto apostado).

Volviendo al juego de lanzar una moneda mencionado al principio, puedes elegir apostar un porcentaje fijo de tu capital y seguir jugando, pero ¿cuánto es lo más razonable para apostar cada vez?

Es decir, la fórmula de Kelly sugiere que inviertas el 37.5% de tu capital total en cada ocasión. Apostar demasiado, incluso teniendo una ventaja, podría llevar a la quiebra directa por unas pocas pérdidas consecutivas; apostar demasiado poco, te hace perder el crecimiento que te corresponde.

El significado de la fórmula de Kelly radica en encontrar ese punto que permite ganar a largo plazo lo máximo posible y, al mismo tiempo, sobrevivir.

Un punto adicional, la fórmula de Kelly es muy sensible a las probabilidades de éxito, pero en la realidad estos parámetros a menudo son inciertos o cambian dinámicamente, por lo que muchos practicantes prudentes optan por la mitad del valor sugerido por Kelly (conocido como la estrategia de medio Kelly) a cambio de un camino de ganancias más suave.

Experimento simulado: en un juego de apuestas con 100,000 personas lanzando monedas, ¿cuántas personas pueden "sobrevivir"?

Para entender de manera más intuitiva el impacto de diferentes estrategias de apuesta en el destino individual, simulé a 100,000 jugadores participando en el juego de lanzamiento de monedas al inicio, realizando un total de 200 rondas, cada uno jugando de manera independiente.

Las reglas del juego siguen siendo: capital de 1000, gana un 80% si sale cara, pierde un 50% si sale cruz. Los jugadores pueden elegir un porcentaje fijo de apuesta: por ejemplo, apostando todo (100%), 65%, 37.5%, …

¡Resultados... los jugadores que apostaron el 100% prácticamente fueron aniquilados!

La riqueza final presenta una "distribución de ley de potencias"; aunque hay muy pocas personas que se enriquecen, la gran mayoría de los jugadores se ha declarado en quiebra.

Compararemos la distribución de la riqueza de los jugadores con estas 4 estrategias de apuesta diferentes; cuanto más a la derecha esté la distribución de activos, mayor será la riqueza de los jugadores.

a. 100% de apuesta: casi todos se declaran en bancarrota

La distribución final de activos bajo la estrategia de apuesta total presenta un gran pico de pobreza a la izquierda + una estructura de cola de riqueza extrema a la derecha: la mayoría de las personas quiebran, mientras que una muy pequeña cantidad gana todo el dinero, esto es una verdadera representación de la asimetría en el juego + el sesgo de supervivencia.

b. 65% de apuestas: sigue la polarización, todavía hay una gran cantidad de personas en quiebra

c. 37.5% de apuesta (Fórmula de Kelly): crecimiento estable de la riqueza

Bajo la estrategia de apuestas de Kelly, la distribución de activos se desplaza claramente a la derecha, la mayoría de las personas ven un crecimiento en sus activos y la distribución se concentra, lo que constituye el modelo óptimo de acumulación de riqueza.

d. Apuesta del 10%: casi nadie quiebra, pero el retorno es demasiado bajo

No hay picos de distribución de quiebra similares a los de un apalancamiento total, pero la riqueza general está concentrada en áreas de bajos activos. En comparación, la estrategia del 37.5% generará una cola larga claramente a la derecha, logrando una multiplicación de activos.

La apuesta de Kelly es la única estrategia que equilibra "no quebrar en la mayoría de los casos" y "una apreciación significativa", siendo la estrategia de supervivencia a largo plazo óptima desde un punto de vista matemático. Esta es la esencia de la fórmula de Kelly: no se trata de ganar lo máximo, sino de asegurarte de que puedas vivir lo suficiente.

La filosofía de vida en la fórmula de Kelly

La fórmula de Kelly nos dice que el secreto del éxito a largo plazo es aprender a controlar la proporción de "apuesta". La vida no se trata de quién puede hacer un gran golpe una vez, sino de quién puede seguir jugando.

En la carrera profesional, no se trata de renunciar impulsivamente por pasión, ni de aferrarse a la zona de confort, sino de planificar continuamente, mejorar las habilidades, atreverse a cambiar de rumbo y dejar una opción abierta.

En la inversión, no se trata de arriesgarlo todo para hacerse rico, sino de controlar la posición según las probabilidades y conservar las fichas.

En una relación, no se trata de depositar todas las emociones y valores en una sola persona, sino de involucrarse mientras se mantiene el yo.

En el crecimiento y la autodisciplina, no se trata de lograr un cambio mediante una explosión única, sino de optimizar la estructura de vida de manera estable y compuesta.

La vida es como un juego largo, tu objetivo no es ganar una vez, sino asegurarte de poder seguir jugando. Mientras no te elimines, siempre habrá cosas buenas que sucederán.

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)