Wir wollen eine Funktion die eine EP Kurve definiert, die nicht linear ist, sondern anfangs mehr EP ausschüttet und später zunehmend weniger.



Idee & Herleitung

Die Funktion $g$ sagt mir wie viele EP ich insgesamt gesammelt habe und die Ableitung $g'$ entsprechend wie viel EP ausgeschüttet werden.

Jetzt interessieren wir uns dafür, wie die ausgeschütteten EP aus den EP die ich gesammelt habe berechnet werden können. Und zwar so dass ich weniger EP ausgeschüttet bekomme je mehr ich bereits verdient habe. Dafür suchen wir eine monoton fallende Funktion $f$ sodass

$$ g'(x) = f(g(x)). $$

Wir wählen

$$ f(y) = \frac{1}{y} $$

und erhalten somit:

$$ g'(x) = \frac{1}{g(x)}

$$

Jetzt wenden wir das explizite Euler-Verfahren an um diese Gleichung numerisch zu lösen:

$$ g(x+\Delta x) = \Delta x \cdot f(g(x)) + g(x) $$

In unserem Fall entspricht die Schrittweite $\Delta x$ den Basis-EP der zu belohnenden Aktion und $g(x + \Delta x)$ den neuen EP und $g(x)$ den alten. Anders gesagt sind die ausgeschütteten EP gleich dem Term $\Delta x \cdot f(g(x))$ in der obigen Formel.

Jetzt multiplizieren wir die Funktion $f$ mit einer Konstante $\gamma$, um zu steuern wie viele Schritte wir brauchen um einen bestimmten EP-Wert zu erreichen. Außerdem gilt: Für $g(x) < \gamma$ werden mehr EP ausgeschüttet als $\Delta x$ und für $g(x) > \gamma$ entsprechend weniger.

Jetzt haben wir nur noch ein kleines Problem: Eigentlich wollen wir $g(0) = 0$ wählen. In $0$ ist die Funktion $f$ aber nicht definiert, weshalb wir den ersten Schritt nicht machen können. Wir müssen also entweder einen Anfangswert $g(\Delta x)$ wählen oder die Funktion $f$ ändern (siehe unten).


Alternativen für $f$

Kaikas-Sonnenfeuer Funktion