\documentclass[a4paper, 12pt]{article}

%===============================================================================
% preamble
%===============================================================================

%=======================================
% language and enconding
%=======================================

\usepackage{amssymb}

\usepackage[T1]{fontenc}
\usepackage[ngerman]{babel}
%\usepackage[utf8]{inputenc}
\usepackage[varnothing]{fontsetup}

\usepackage[usenames,dvipsnames]{color}
\usepackage{listings}
\lstset{
  language=R,                     % the language of the code
  basicstyle=\small\ttfamily, % the size of the fonts that are used for the code
  numbers=none,                   % where to put the line-numbers
  numberstyle=\color{Blue},  % the style that is used for the line-numbers
  stepnumber=1,                   % the step between two line-numbers. If it is 1, each line
                                  % will be numbered
  numbersep=5pt,                  % how far the line-numbers are from the code
  backgroundcolor=\color{white},  % choose the background color. You must add \usepackage{color}
  showspaces=false,               % show spaces adding particular underscores
  showstringspaces=false,         % underline spaces within strings
  showtabs=false,                 % show tabs within strings adding particular underscores
  frame=lines,                   % adds a frame around the code
  rulecolor=\color{black},        % if not set, the frame-color may be changed on line-breaks within not-black text (e.g. commens (green here))
  tabsize=2,                      % sets default tabsize to 2 spaces
  captionpos=b,                   % sets the caption-position to bottom
  breaklines=true,                % sets automatic line breaking
  breakatwhitespace=false,        % sets if automatic breaks should only happen at whitespace
  keywordstyle=\color{RoyalBlue},      % keyword style
  commentstyle=\color{YellowGreen},   % comment style
  stringstyle=\color{ForestGreen},
  framesep = \baselineskip,
  abovecaptionskip = 2\baselineskip
}
\renewcommand{\lstlistingname}{Code}

%=======================================
% layout
%=======================================

\usepackage[onehalfspacing]{setspace}
\usepackage{layouts}
\usepackage{tikz}
\usepackage{fancyvrb}


\usepackage{geometry}
% \geometry{top=30mm, left=25mm, right=25mm, bottom=30mm, headsep=10mm, footskip=12mm}
\usepackage{microtype}

\newcommand*{\figuretitle}[1]{%
    {\centering%   <--------  will only affect the title because of the grouping (by the
    \textbf{#1}%              braces before \centering and behind \medskip). If you remove
    \par\medskip}%            these braces the whole body of a {figure} env will be centered.
}

%=======================================
% penalties
%=======================================

\hyphenpenalty=6000
\clubpenalty=10000
\widowpenalty=10000

%=======================================
% graphics and trees
%=======================================

\usepackage{graphicx}

%=======================================
% tables
%=======================================

\usepackage{booktabs}
\usepackage{tabto}
\usepackage{tablefootnote}
\usepackage[hang]{footmisc}
\addtolength{\footnotesep}{2mm}

%=======================================
% lists, arrays and urls
%=======================================

\usepackage{paralist}
\usepackage{array}
\usepackage{enumerate}
\usepackage{outlines}
\usepackage[]{url}

%=======================================
% captions
%=======================================

\usepackage{caption}
\captionsetup{font= normalsize, labelfont = {bf, color = swiss}}
\usepackage{subcaption}

%=======================================
% maths
%=======================================

\usepackage{amsmath, amsfonts, amsthm, bbm, mathrsfs}
\usepackage{unicode-math}

\usepackage{natbib}


%=======================================
% links
%=======================================

% has to be at the end
\usepackage{xcolor}
\definecolor{swiss}{RGB}{218, 41, 28}
\usepackage[
    raiselinks, colorlinks, pdfborder={0 0 0},
    bookmarksopen=true, bookmarksnumbered, allcolors = swiss
    ]{hyperref}

%=======================================
% numbering
%=======================================

\numberwithin{equation}{section}
\numberwithin{figure}{section}
\numberwithin{table}{section}
\renewcommand\theequation{{\color{swiss}\thesection.\arabic{equation}}}
\let\oldthepage\thepage
\renewcommand*\thepage{\small{-- \oldthepage\ --}}

%=======================================
% bsv
%=======================================


% \renewcommand{\familydefault}{\sfdefault}


% Inclusion of logo
\makeatletter
% Define content of title page
\def\@maketitle{
  \begin{minipage}[t]{.45\textwidth}
    \vspace*{-1.75cm}
    \hspace*{-1.10cm}
    \includegraphics{logo-small.pdf}
  \end{minipage}
  \hfill
  \begin{minipage}[t]{.55\textwidth}
    \vspace*{-1.62cm}
    \begin{footnotesize}
      \hspace*{0.15\textwidth}
      \parbox{0.83\textwidth}{
       Eidgenössisches Departement des Innern \\
        \textbf{Bundesamt für Sozialversicherungen (BSV)} \\
       }
     \end{footnotesize}
  \end{minipage}
}
\makeatother

\author{}
\date{\vspace{-2.5em}}


%===============================================================================
% body
%===============================================================================

\begin{document}

%\printinunitsof{in}\prntlen{\textwidth}

%=======================================
% titel
%=======================================

\maketitle

\vspace{1cm}

% \footnotesize \noindent \textbf{Notiz}

\huge\noindent \textbf{Methodenbeschrieb zum \\Basismodell der AHV-Ausgaben}

\noindent \rule{\textwidth}{0.5pt}

\normalsize

\noindent \textbf{Datum:} \tabto{5cm} \today

\noindent \textbf{Geschäftsfeld:} \tabto{5cm} Mathematik, Analysen und Statistik (MAS)

\noindent \textbf{Bereich:} \tabto{5cm} Mathematik

\vspace{-0.3cm}

\noindent \rule{\textwidth}{0.5pt}


%=======================================
% Inhalt
%=======================================

{\hypersetup{allcolors=black}
\tableofcontents
}

\section{Einleitung}

\subsection{Motivation}

\noindent Das Bundesamt für Sozialversicherungen (BSV) hat 2024 ein neues Berechnungsmodell zur Projektion der jährlichen AHV-Ausgaben entwickelt. Es wird als das «Basismodell» bezeichnet. Ziel dieses Dokuments ist es, die Grundlagen und Funktionsweise dieses Modells zu erläutern.

Der Name des Basismodells reflektiert, dass es nach dem Grundsatz «simpel, robust und offen» konstruiert wurde.

\begin{outline}

\1 Das Modell ist «simpel», da es ausschliesslich auf aggregierten demografischen sowie ökonomischen Daten basiert, und diese durch schlichte funktionale Zusammenhänge mit den Ausgaben der AHV verknüpft. Dadurch führen Änderungen der Inputs zu einfach nachvollziehbaren Änderungen der Projektionen. Diese Nachvollziehbarkeit erleichtert die Kontextualisierung und Plausibilisierung prognostizierter Entwicklungen, wie beispielsweise die Pensionierungswelle der Baby-Boom-Generation.

\1 Das Modell ist «robust», da kleine Änderungen der Daten oder Parameter zu kleinen Änderungen der Projektionen führen. Folglich sind die Resultate nicht übermässig von einzelnen, womöglich diskutablen Annahmen abhängig, sondern fest verankert in der Demografie sowie rezenten Trends der Durchschnittsrenten im In- und Ausland. Diese Stabilität verringert sowohl die Fehleranfälligkeit der Berechnungen als auch die Abhängigkeit von einer unrealistischen Messgenauigkeit der Inputs.

\1 Das Modell ist «offen», da alle verwendeten Daten sowie der Modell-Code in der Programmiersprache \textsf{R} öffentlich zugänglich sind. Der Programm-Code ist ausführlich kommentiert, was einem breiten Publikum die Reproduktion der Ergebnisse unter angemessenem Aufwand ermöglichen soll.

\end{outline}

Bevor das Basismodell eingeführt wird folgt zunächst eine Beschreibung des generellen Schätzproblems, welchem sich das BSV gegenübersieht. Diese Beschreibung dient dann als Ausgangspunkt zur mathematischen Darstellung des Basismodells.

\subsection{Projektionsproblem}
Das BSV hat die Aufgabe jährlich den Finanzhaushalt der AHV neu zu berechnen. Dazu müssen unter anderem die zukünftigen Gesamtausgaben der AHV pro Jahr geschätzt werden. Diese Ausgaben sind in erster Linie von den Altersrenten getrieben, welche beispielsweise im Jahr 2023 ungefähr 95\% der totalen Kosten ausmachten. Der Einfluss anderer Rententypen sowie diverser administrativer Aufwände ist dennoch nicht zu vernachlässigen. Grundsätzlich wird bei der Berechnung der Finanzhaushalte unterstellt, dass die geltende gesetzliche Ordnung zum Zeitpunkt der Projektionserstellung stabil bleibt. Ausnahme dazu sind Gesetzesänderungen, die bereits heute beschlossen aber noch nicht (vollständig) in Kraft getreten sind. Das betrifft zur Zeit beispielsweise die Reform AHV 21 sowie die Auszahlung der 13. AHV-Rente ab 2026, welche beide berücksichtigt werden. Damit lässt sich der Informationsbedarf zur Projektionserstellung wie folgt zusammenfassen.

\subsubsection{Schätzgleichung}

Wir schreiben $\tau$ für einen «Typ», welcher eine der möglichen Kombinationen der Menge $\textit{Geschlecht} \times \textit{Domizil} \times \textit{Rentenart}$ repräsentiert. Die verschiedenen Rentenarten umfassen dabei die Alters-, Witwen-, Waisen- und Kinderrenten. Bei den Waisen- und Kinderrenten wird nicht unterschieden, ob der Vater oder die Mutter verstorben bzw. verrentet sind. Zudem werden doppelte Waisenrenten zur Vereinfachung wie einzelne Waisenrenten verbucht.\footnote{\onehalfspacing Die Ehegattenzusatzrenten, welche ehemals Rentnern mit bislang unverrenteten Ehefrauen zugesprochen wurden, werden dabei ignoriert. Grund ist, dass diese Zusatzrenten seit Inkrafttreten der 10. AHV-Revision in 1997 nicht mehr ausgesprochen werden, und der Restbestand kaum noch Einfluss auf die AHV-Ausgaben nimmt.} Das Domizil bezeichnet entweder die Schweiz oder das Ausland. Ein beispielhafter Typ $\tau$ sind daher in der Schweiz wohnhafte Frauen, die eine Altersrente beziehen. Wir schreiben $\#_{\tau, t}$ für die Anzahl Renten des Typs $\tau$, welche im Kalenderjahr $t$ ausbezahlt werden. Dazugehörig bezeichnet $\varnothing_{\tau, t}$ die durchschnittliche Höhe von Typ-$\tau$ Renten, gemessen in Schweizer Franken zu laufenden Preisen. Wir schreiben $a_t$ für die AHV-Gesamtausgaben des Jahres $t$, und $t_0$ für das Jahr über welches hinaus die Ausgaben projiziert werden (für den Finanzhaushalt 2025 gilt also beispielsweise $t_0 = 2024$). Zusätzlich sei $h$ die Anzahl Jahre, welche die Projektion in die Zukunft reicht. Sofern $m_t$ die gesetzliche Minimalrente bei voller Skala des relevanten Jahres bezeichnet, so ist nun folgende Summe zu schätzen:
\begin{align} \label{f2i43rh29038rh}
	a_{t} & = \sum\nolimits_\tau \Big( \#_{\tau, t} \times \varnothing_{\tau, t} \Big) + \text{Andere}_t +  \varepsilon_{a,t} \\
	& = m_t \times \sum\nolimits_\tau \Big( \#_{\tau, t} \times (\varnothing_{\tau, t} / m_t) \Big) + \text{Andere}_t + \varepsilon_{a, t} \quad\text{für}\;\; t = t_0 + 1, \dots, h \nonumber
\end{align}
Der Term «$\text{Andere}_t$» bezeichnet dabei Ausgaben abseits der Renten, wie beispielsweise Durchführungskosten oder Hilflosenentschädigungen. Der Summand $\varepsilon_{a,t}$ ist eine Störgrösse, welche stochastische und unmodellierte Einflüsse auf die Ausgaben reflektiert. Ein Beispiel für solch einen Einfluss sind ausserordentlich hohe Rückvergütungen von AHV-Beiträgen ins Ausland.\footnote{\onehalfspacing Das Jahr 2014 liefert ein Beispiel für solche ungewöhnlich hohen Rückzahlungen, welches unter anderem durch die Annahme der eidgenössischen Initiative «Gegen Masseneinwanderung» im Februar des selben Jahres getrieben ist.} Es wird angenommen, diese Störgrösse sei in Erwartung gleich Null (heisst, alle systematischen Komponenten der AHV-Ausgaben werden durch die Rentensummen sowie die restlichen Posten erfasst). Nachfolgend wird die Epsilon-Notation stets benutzt, um solche statistischen Störgrössen zu bezeichnen. Die gleichzeitige Multiplikation und Division mit $m_t$ in der zweiten Zeile von \eqref{f2i43rh29038rh} scheint zunächst wirkungslos, ist aber für das Projektionsproblem wichtig. Der Grund ist, dass das Staatssekretariat für Wirtschaft (SECO) vierteljährlich Projektionen für den Landesindex der Konsumentenpreise (LIK) und den Schweizer Lohnindex (SLI) zur Verfügung stellt. Aus diesen Projektionen lassen sich ihrerseits die zukünftigen gesetzlichen Minimalrenten projizieren, welche somit als von aussen vorgegebene Information in die Berechnungen einfliessen. Folglich reduziert sich das Extrapolationsproblem darauf, die Durchschnittsrenten relativ zu, oder äquivalent ausgedrückt als Vielfaches von, der gesetzlichen Minimalrente fortzuschreiben. Aus praktischen Gründen werden die beobachteten monatlichen Rentensummen im Dezember des jeweiligen Jahres mit zwölf multipliziert, und als erklärende Variable in \eqref{f2i43rh29038rh} für die Gesamtausgaben verwendet.

\subsubsection{Nebenkosten}

Bevor der Schätzsansatz der Gleichung besprochen wird erlaubt uns eine empirische Regelmässigkeit, das Schätzproblem zu vereinfachen: die AHV-Ausgaben, welche zusätzlich zu den Renten anfallen, liegen seit 2008 in der Nähe von 2\% der Rentensumme. Grafik \ref{234ru2439082} veranschaulicht diese Tatsache. Anders ausgedrückt begannen die Kosten neben den Renten über die letzten Jahre ungefähr im Gleichschritt mit den Rentenausgaben zu wachsen, und diese Proportionalität rechtfertigt eine Vereinfachung von Schätzgleichung \eqref{f2i43rh29038rh} in zwei Schritten:

\begin{figure}
  \includegraphics{viz_zas}
  \caption{\onehalfspacing Gegenüberstellung der AHV-Ausgaben abseits der Rentenzahlungen (orange) und der auf das Jahr hochskalierten Dezember-Rentensummen (dunkelgrün) relativ zu den totalen Ausgaben. «Andere Posten» umfassen dabei unter anderem Beiträge an Institutionen und Organisationen, welche gemäss Art. 101bis AHVG beispielsweise die Finanzierung von gemeinnützigen Organisationen zur Altershilfe unterstützen, Überweisungen und Rückvergütungen von Beiträgen bei Ausländer(inne)n, Hilflosenentschädigungen, Fürsorgeleistungen an Schweizer(innen) im Ausland sowie Hilfsmittel, Reisekosten und den Assistenzbeitrag im Rahmen von individuellen Massnahmen. Rückerstattungsforderungen sind nicht berücksichtigt. \textit{Quelle}: Betriebsrechnung der Zentralen Ausgleichsstelle. Für 2005 und später sind die Daten in den Geschäftsberichten der AHV-Fondverwaltung «compenswiss» ablesbar (siehe \url{https://www.compenswiss.ch/de/informationen/geschaeftsberichte}). \label{234ru2439082}}
\end{figure}
\vspace{-\baselineskip}
\begin{align}
  a_{t} & = \beta_a \times m_t \times \sum\nolimits_\tau \Big( \#_{\tau, t} \times (\varnothing_{\tau, t} / m_t) \Big) + \varepsilon_{a, t} \nonumber \\
        & = \beta_a \times m_t \times \Big( \#_t \times (\varnothing_t / m_t) \Big) + \varepsilon_{a, t}, \;\; \text{wobei}                                                   \nonumber \\
   \#_t & \equiv \sum\nolimits_\tau \#_{\tau, t} \quad \text{und} \quad \varnothing_t \equiv \frac{\sum_\tau \#_{\tau, t} \times \varnothing_{\tau, t}}{\sum_\tau \#_{\tau, t}} \label{f4oijf20934r2}
\end{align}
Der im ersten Schritt eingeführte Parameter $\beta_a$ skaliert hierbei die Rentensumme, sodass im Mittel die Gesamtausgaben $a_t$ resultieren.
Diese Skalierung macht den Term «$\text{Andere}_t$» aus Schätzgleichung \eqref{f2i43rh29038rh} obsolet. Im zweiten Schritt wird zusätzlich die Summe der verschiedenen Rententypen zu einer einzigen «synthetischen» Rente konsolidiert. Der Bestand dieser fiktiven Rente entspricht der Summe aller Rentenbestände, und ihre Durchschnittshöhe dem bestandsgewichteten Mittelwert aller Rentenniveaus nach Typ. Zur Schätzung des Parameters $\beta_a$ wird die Methode der kleinsten Quadrate, oder «Ordinary Least Squares» (OLS) verwendet. Der resultierende geschätzte Parameter ist $\hat{\beta}_a$, mit analoger Notation für andere Schätzgrössen.\footnote{\onehalfspacing Tatsächlich werden die Ausgabendifferenzen $a_t - a_{t - 1}$ geschätzt anstatt der jährlichen Niveaus, um Anbindungsprobleme mit den letzten beobachteten Gesamtausgaben zu vermeiden. Da der Achsenabschnitt in Levels aufgrund bereits genannter Argumente entfernt wurde ist der Unterschied in den resultierenden Schätzwerten für $\beta_a$ gering. Die Ableitung der entsprechenden Schätzgleichung in Differenzen ist klar.}

\subsubsection{Regression}

Code-Abschnitt \textcolor{swiss}{1} zeigt den \textsf{R}-Output der Regression gemäss Gleichung \eqref{f4oijf20934r2} auf Basis der Daten von 2008 bis 2023. Der Schätzwert beträgt zirka $\hat{\beta}_a \approx 1.02$ (siehe «Estimate»), sodass im Mittel ein Aufschlag von ungefähr 2\% die Rentensumme in die Gesamtausgaben übersetzt. Dieses Ergebnis ist konsistent mit der Diskussion im Kontext von Grafik \ref{234ru2439082}. Zusätzlich attestiert der Output einen exzellenten In-Sample Fit: ein adjustiertes $R^2$ von nahezu Eins zeigt, dass die Spezifikation nahezu alle historische Variation in den Daten abbildet.

\begin{lstlisting}[caption = {\onehalfspacing Output der \textsf{R}-Funktion \textsf{lm}, welche eine
lineare Regression der beobachteten AHV-Gesamtausgaben von 2008-2023 auf das Produkt der Anzahl Renten («n»), der relativen Durchschnittsrente («m») sowie der Minimalrente («mi») ausführt. Relevant ist hier die synthetische Rente, welche in Gleichung \eqref{f4oijf20934r2} definiert wird. Die Werte für «Multiple R-squared» und «Adjusted R-squared» sind auf die siebte Nachkommastelle gerundet.\label{09rj32409re}}, float, floatplacement = H]
Call:
lm(formula = exp_p ~ 0 + n:m:mi, data = filter(p_dat,
   year %in% 2008:(p_start - 1)))

Residuals:
      Min        1Q    Median        3Q       Max
-58909471 -29949863  -9000177  16708935  79164875

Coefficients:
        Estimate Std. Error t value Pr(>|t|)
n:m:mi 1.0195097  0.0002655    3840   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 43970000 on 15 degrees of freedom
Multiple R-squared:      1,	Adjusted R-squared:      1
F-statistic: 1.475e+07 on 1 and 15 DF,  p-value: < 2.2e-16

\end{lstlisting}

Während Abbildung \ref{234ru2439082} und der Regressionsoutput nahelegen, $\hat{\beta}_a$ anhand aller Datenpunkte seit 2008 zu berechnen, könnte eine Einschränkung auf rezentere Jahre dennoch ratsam sein -- mehr dazu später, wie diese Entscheidung anhand eines statistischen Verfahrens getroffen wird. Bis dahin wird zuerst geklärt, wie die Rentenbestände $\#_{\tau, t}$ sowie die relativen Durchschnittsrenten $\varnothing_{\tau, t} / m_t$ projiziert werden.

\section{Basismodell}

\subsection{Daten}

Das Modell verwendet im Wesentlichen fünf Datensätze, um die unbeobachteten erklärenden Variablen der ausländischen Rentenbestände sowie der relativen Durchschnittsrenten im In- und Ausland in Gleichung \eqref{f4oijf20934r2} abzuschätzen:
\begin{outline}
  \1[1.] Die Statistik der Bevölkerung und der Haushalte (STATPOP), welche jährlich die Struktur der Schweizer Wohnbevölkerung dokumentiert. Zum Zeitpunkt der jährlichen Erstellung der Finanzhaushalte ist dieser Datensatz in der Regel mit zwei Jahren Rücklauf zum ersten Projektionsjahr verfügbar. Dieser Datensatz enthält unter anderem die historische Anzahl von in der Schweiz wohnhaften Personen (genauer gesagt die «ständige Wohnbevölkerung»), gruppiert nach Lebensalter, Geschlecht und Nationalität.
  \1[2.] Die Bevölkerungsszenarien des BFS, welche Projektionen über die ständige Schweizer Wohnbevölkerung der kommenden Jahrzehnte beinhalten. Aktuell sind drei Varianten von Belang: das Referenzszenario (A-00-2025), welches zur Erstellung der Gesamtausgaben-Referenzprojektion benutzt wird, sowie die BFS-Szenarien «Hoch» (B-00-2025) und «Tief» (C-00-2025). Letztere bereiten Bänder für eine ausgeprägtere beziehungsweise gedämpftere Bevölkerungsentwicklung als historische Trends nahelegen, und werden vom BSV für die Berechnung der Unsicherheitsbandbreiten rund um die Referenzprojektion genutzt.
  \1[3.] Das Rentenregister der ersten Säule, welches seit 1997 die von der Schweiz ausgezahlten AHV-Renten auf dem individuellen Level im In- und Ausland dokumentiert.
  \1[4.] Die quartalsweise veröffentlichten Eckwerte des SECO, aus welchen Projektionen der zukünftigen Minimalrenten abgeleitet werden.
  \1[5.] Eine Schätzung des Einflusses der Reform AHV 21 auf die Ausgabenentwicklung, welche auf einem BSV-internen kohorten-basierten Ausgabenmodell basieren.
\end{outline}

Im ersten Schritt wird nun erklärt, wie STATPOP, die Bevölkerungsszenarien und das Rentenregister gemeinsam auf die zukünftigen Rentenbestände innerhalb der Schweiz abgebildet werden.

\subsection{Adjustierung der Bevölkerungsszenarien}

Zwei Hürden sind zu überwinden, um die zukünftigen Rentenbeziehenden innerhalb der Schweiz anhand der Bevölkerungsszenarien zu projizieren. Erstens ist die Bevölkerungszahl über dem Referenzalter der Frauen oder Männer nicht gleichzusetzen mit der Anzahl von Altersrentenbeziehenden. Beispielsweise beziehen nicht alle Männer über 65 eine Altersrente und andere fordern sie wiederum schon früher ein. Dieser Aspekt des Rentenvorbezugs und -aufschubs spielt angesichts der Reform AHV 21 eine zunehmende Rolle, da sie seit dem 1. Januar 2024 die Bezugsmöglichkeiten flexibilisiert. Zweitens gibt es innerhalb der Schweiz einen substantiellen Anteil von Menschen im Rentenalter, welche überhaupt keine Altersrente beziehen. Beispielsweise betrug der Anteil von Nicht-Beziehenden im Alter 71 mit ausländischer Nationalität in 2023 fast dreizehn Prozent (Treiber für diese hohe Nichtbezugs-Quote sind unter anderem wohlhabende Ausländer, welche Sozialleistungen aus anderen Ländern beziehen und die Schweiz als Altersruhesitz wählen).\footnote{\onehalfspacing Im Allgemeinen liegen die so berechneten Rentenbezugsquoten auch für Inland-Schweizer im Alter von über 70 Jahren nicht bei Eins, und manchmal sogar darüber. Grund für letzteren Fall ist, dass die ständige Wohnbevölkerung in STATPOP exakt am letzten Tag des Jahres erfasst wird. Im Rentenregister hingegen werden alle Rentenansprüche abgebildet, welche \textit{während} dem Dezember anfallen. Das kann dazu führen, dass eine rentenbeziehende Person zwar in diesem Monat eine Rentenauszahlung erhält, bis Ende Dezember allerdings verstirbt, Geburtstag hat oder ausreist. In diesen Fällen kann es unter dem gewählten Rechenansatz mehr Rentenauszahlungen als potentiell Rentenerhaltende geben.} Drittens werden die Bevölkerungsszenarien des BFS nur alle fünf Jahre erstellt, und sind damit zum Zeitpunkt der Projektionserstellung fallweise veraltet. Folglich kann eine Adjustierung der Demografie-Szenarien angebracht sein, um Sprünge im ersten Projektionsjahr aufgrund einer fehlenden Anbindung zwischen den beobachteten und Szenario-bedingten Bevölkerungszahlen zu vermeiden.

Um der Relevanz des Rentenvorbezugs und -aufschubs sowie des Nicht-Bezugs Rechnung zu tragen, und gleichzeitig das Adjustierungsproblem zu lösen, wird wie folgt verfahren. Zunächst werden die faktisch bezogenen Renten gemäss Rentenregister im Jahr $t_0 - 1$ erfasst. In Kombination mit den STATPOP-Daten desselben Jahres erlaubt dies die Kalkulation der Rentenbezugsquoten $q_{\omega, t_0 - 1}$, wobei $\omega \equiv \textit{Geschlecht} \times \textit{Nationalität} \times \textit{Alter}$ die relevanten Gruppen-Unterscheidungen in den Demografie-Szenarien bezeichnet (wiederum unterscheidet «Nationalität» nur zwischen «Schweiz» und «Ausland»). Solch eine Quote bemisst den Anteil von tatsächlichen ausgezahlten Typ-$\omega$ Renten am Bestand der potentiell Beziehenden. Diese Bezugsquoten werden dann auf die Szenario-Daten des Jahres $t_0$ angewendet, um retrospektive Prognosen für die Rentenbestände zu erhalten.\footnote{\onehalfspacing Im Jahr 2025 ist das Verfahren leicht anders. In der diesjährigen Veröffentlichung der neuen Bevölkerungsszenarios wurden provisorische Bevölkerungszahlen für 2024 angehängt, an welche die Szenarios anknüpfen. Deshalb werden die berechneten Bezugsquoten ausnahmsweise auf diese provisorischen Daten angewandt.} Diese Prognosen weichen im Allgemeinen von den beobachteten Rentenbeständen ab, welche vom Rentenregister ablesbar sind, und diese Diskrepanzen werden nun zur Adjustierung genutzt. Sofern $p_{\omega, t}$ die Anzahl von potentiellen Typ-$\omega$ Rentenbeziehenden im Jahr $t$ gemäss Bevölkerungsszenario bezeichnet, und $m_\omega$ den Justierungsfaktor, mit welchem die relevanten Bevölkerungsgruppen in den Demografie-Szenarien ab $t_0 + 1$ multipliziert werden, so gilt
\begin{equation} \label{4eofjr409j}
	m_\omega \equiv \frac{\#_{\omega, t_0}}{q_{\omega, t_0 - 1} \times p_{\omega, t_0}}.
\end{equation}
Anders ausgedrückt wird $m_\omega$ berechnet, sodass $p_{\omega, t_0} \times m_\omega$ unter den Rentenbezugsquoten in $t_0 - 1$ die beobachteten Rentenbestände in $t_0$ reproduziert. In den Folgejahren wird dann $p_{\omega, t} \times m_\omega$ als adjustierte Szenario-Projektionen für alle Jahre über $t_0$ hinaus verwendet. Abschliessend werden die so projizierten Rentenbestände über die Lebensalter und Nationalität aufsummiert. Grafik \ref{fkgnj429023} illustriert am Beispiel der Altersrenten nach Geschlecht, wie dieser Ansatz zu einer plausiblen Anknüpfung der projizierten Bestände an die historische Entwicklung führt.\footnote{\onehalfspacing Der Effekt der Reform AHV 21 auf den Rentenbestand der Frauen aufgrund der Referenzaltererhöhungen wird hier nicht abgebildet. Später wird erklärt, wie dieser Effekt dennoch Eingang in die Ausgabenprojektion findet.}

\begin{figure}
  \includegraphics{viz_adj}
  \caption{\onehalfspacing Bestandsprojektionen der Altersrenten nach Geschlecht im Zeitraum 2024-2040, wenn die im Jahr 2020 veröffentlichten Bevölkerungsszenarien des BFS gemäss Gleichung \eqref{4eofjr409j} adjustiert werden. Die Kurven beziehen sich auf die Szenarios «A-00-2020» (Referenz, purpur), «B-00-2020» (Hoch, orange) und «C-00-2020» (Tief, pink). \textit{Quelle:} \url{https://www.bfs.admin.ch/bfs/de/home/statistiken/bevoelkerung/zukuenftige-entwicklung/schweiz-szenarien.html}.\label{fkgnj429023}}
\end{figure}

Die adjustierten Bevölkerungsszenarios liefern Projektionen für die Rentenbestände im Inland.\footnote{\onehalfspacing Wiederum gibt es hier eine Besonderheit für das Jahr 2025, da in den Rentenbezugsquoten des Jahres 2023 ein leichter Strukturbruch relativ zum Vorjahr erkennbar ist. Grund dafür ist unter anderem die Umregistrierung von Flüchtlingen in die ständige Wohnbevölkerung, welche seit mehr als einem Jahr in der Schweiz wohnhaft sind. Diese Reklassifizierung hat zur Folge, dass Personen im gehobenen Alter und ohne Rentenansprüche plötzlich «auftauchen». Da dieses Phänomen voraussichtlich nur temporär ist, und dessen Extrapolation deshalb fragwürdig wäre, wird die Szenario-Adjustierung für 2025 leicht angepasst: einerseits werden die Rentenbezugsquoten des Jahres 2022 statt 2023 verwendet, und andererseits werden die Szenarien additiv statt multiplikativ adjustiert. Die additive Adjustierung ist in der Regel konservativer als die multiplikative, und sollte besser in der Lage sein, die Einpflegung der Flüchtlinge in höheren Altersgruppen als vorübergehendes Phänomen abzubilden.} Für die Rentenpopulation im Ausland sind allerdings keine analogen Demografie-Szenarios verfügbar. Der nächste Abschnitt erkläert, wie die ausländischen Rentenbestände und gleichzeitig auch die Durchschnittsrenten im In- und Ausland aus historischen Entwicklungen abgeleitet werden.

\subsection{Auslands-Rentenbestände und Durchschnittsrenten}

Das Basismodell folgt dem Prinzip, dass alle erklärenden Variablen, über welche keine ausschlaggebenden exogenen Informationen vorliegen -- Beispiele für solche Informationen sind antizipierte Gesetzesänderungen, oder ausserordentliche Kohorten wie die Baby-Boomer -- anhand linearer Trends über die Zeit fortgeschrieben werden. Dies betrifft die Anzahl ausgezahlter AHV-Renten im Ausland sowie die Durchschnittsrenten im In- und Ausland relativ zur gesetzlichen Minimalrente. Eine Ausnahme hierzu sind die Verwitwetenrenten, deren Aussprachebedingungen sich kürzlich geändert haben. Dieses Phänomen wird später noch diskutiert.

Formell ausgedrückt wird anhand folgender Gleichungen pro Typ die jährliche Veränderung des Rentenbestands im Ausland beziehungsweise der Durchschnittsrente im In- und Ausland geschätzt:
\begin{align} \label{fih298323}
     \Delta \#_{\tau, t} \equiv \#_{\tau, t} - \#_{\tau, t - 1} & = \beta_{\#, \tau} + \varepsilon_{\#, \tau, t} & \\ \label{pöpgif}
    \Delta \varnothing_{\tau, t} / m_t \equiv \varnothing_{\tau, t} / m_t - \varnothing_{\tau, t - 1} / m_{t - 1} & = \beta_{\varnothing, \tau} + \varepsilon_{\varnothing, \tau, t}
\end{align}
Die Schätzungen erfolgen in Differenzen statt Niveaus, um die Anbindung der Projektionen an die letzte Beobachtung zu gewährleisten.

Die zu schätzenden Parameter sind also die Trendsteigungen $\beta_{\#, \tau}$ und $\beta_{\varnothing, \tau}$. Hier ist zu entscheiden, wie weit man zu deren Schätzung in die Vergangenheit zurückschaut: wie viele Beobachtungen der vergangenen Jahre von $t_0$ abwärts sollen verwendet werden? Wir schreiben $d_{\#, \text{au}}$ für die Anzahl verwendeter konsekutiver Jahre zur Schätzung der Parameter in Gleichung \eqref{fih298323}, und analog $d_{\varnothing, \text{ch}}$ respektive $d_{\varnothing, \text{au}}$ für Gleichung \eqref{pöpgif} (eine Unterscheidung nach Geschlecht wird nicht vorgenommen). Zusätzlich muss eine Anzahl von Beobachtungen $d_a$ zur Schätzung von Gleichung \eqref{f4oijf20934r2} gewählt werden. Zusammengefasst gilt in Vektorschreibweise
\begin{equation}
	\boldsymbol{d} \equiv (d_{\#, \text{au}}, d_{\varnothing, \text{ch}}, d_{\varnothing, \text{au}}, d_a).
\end{equation}
Diese Parameter werden nachfolgend «Trendpunkte» genannt. Bei deren Festlegung muss nun ein Kompromiss gefunden werden zwischen der Schätzgenauigkeit der Parameter (mehr Punkte sind besser) und der Aktualität der Information (mehr Punkte sind ein Risiko). Bei zu grosszügig gewählten Trendpunkten besteht die Gefahr, nicht mehr wirksame Trends der jüngeren Vergangenheit zu extrapolieren. Dies kann zu systematischen Projektionsfehlern führen, welche den Gewinn an Schätzpräzision überkompensieren. Grafik \ref{po50i4395ui34} illustriert das Dilemma anhand eines Beispiels.

Das Bild zeigt links der vertikalen, grauen Linie die beobachteten Durchschnittsrenten im Ausland lebender Männer bis 2023 (Kreuze, historisch). Die Frage ist nun, wie die Entwicklung dieser Beobachtungen in die Zukunft fortgesetzt werden soll. Die drei farbigen Linien zeigen Trendschätzungen auf Basis von zwei (purpur), zehn (grün) sowie vierzehn Trendpunkten (orange). Welche dieser drei Trendfortsetzungen zu bevorzugen ist hängt davon ab, wie sich die zukünftigen Durchschnittsrenten tatsächlich verhalten werden. Rechts der grauen Linie sind drei fiktive, Computer-generierte Verläufe aufgezeigt. Das obere Szenario A (Punkte) zeigt eine Weiterführung des rezenten historischen Trends hin zu stark steigenden Renten. In diesem Fall wäre die Stützung auf zwei Punkte klar die beste Wahl. Wenn hingegen das tiefe Szenario B eintreten würde (Dreiecke), so wäre die purpurne Linie die schlechteste Option. Selbst die orange Linie, welche einen zunächst unplausibel scheinenden Abwärtssprung in 2024 vorhersagt, ist in diesem Szenario schon ab 2025 wesentlich näher an der tatsächlichen Entwicklung. Die grüne Linie basierend auf zehn Punkten schlägt sich hier im Vergleich «mittelgut», wobei sie das mittlere Szenario C (Quadrate) eventuell am Besten abbildet.

\begin{figure}
  \includegraphics{viz_ex}
  \caption{\onehalfspacing Illustration des Trendpunkt-Auswahlproblems anhand eines univariaten Beispiels, wenn ausser historischen Verläufen keine weiteren Informationen vorliegen. Die graue vertikale Linie trennt die Beobachtungen (Kreuze, historisch) von drei fiktiven zukünftigen Verläufen: Szenario A (Punkte), B (Dreiecke) und C (Quadrate). Die drei farbigen Linien repräsentieren lineare Trends, welche anhand der letzten zwei (purpur), zehn (grün) oder vierzehn (orange) Beobachtungen via OLS geschätzt wurden. \label{po50i4395ui34}}
\end{figure}

Die Auswahl der Trendpunkte stellt also eine schwierige und folgenreiche Entscheidung dar. Wichtig ist hierbei, dass nicht das genaue Treffen der individuellen Trends über die Rentenbestände oder -durchschnittshöhen im Vordergrund steht. Stattdessen zählt, wie die Trendpunkte die Präzision der Gesamtausgaben-Projektionen beeinflussen. Angesichts der Komplexität dieser Aufgabe -- immerhin müssen insgesamt sechzehn Trends geschätzt werden aufgrund der gewählten Partition nach Geschlecht, Domizil und Rentenart -- ist eine manuelle Festsetzung der Trendpunkte fragwürdig. Stattdessen wird ein statistischer Ansatz verfolgt, die sogenannte «Schiebefenster-Kreuzvalidierung». Dieses Verfahren beantwortet die folgende Frage: wie präzise hätte das Modell die AHV-Gesamtausgaben vergangener Jahre prognostiziert, wenn $a$ Trendpunkte für die Durchschnittsrenten im Ausland, $b$ Punkte für die Durchschnittsrenten im Inland ... verwendet worden wären? Auf diese Weise wird einerseits eine Quantifizierung der allgemeinen Modellqualität möglich, welche von eigenem Interesse ist. Andererseits erlaubt es die Minimierung dieser historischen Fehlerquote, die Trendpunkte systematisch und statistisch fundiert zu festzulegen.

Nachfolgend ein Beispiel zum Verfahren: nehmen wir an, eine Quantität $z_t$ soll mithilfe einer erklärenden Variable $x_t$ projiziert werden. Es gibt nur einen Typ, weshalb eine Indizierung nach $\tau$ entfällt. Die Schätzgleichung ist
\begin{equation} \label{zhj986945}
  z_t = \beta_z \times x_t + \varepsilon_{z, t}.
\end{equation}
Wiederum ist $\beta_z$ ein zu schätzender Parameter. Wie zuvor sind die erklärenden Variablen $x_t$ in der Zukunft unbekannt und müssen ihrerseits extrapoliert werden. Analog zu \eqref{fih298323} respektive \eqref{pöpgif} werden deshalb die zukünftigen Realisationen der erklärenden Variable durch eine lineare Fortschreibung abgeschätzt. Nehmen wir nun weiter an, es seien insgesamt $n = 10$ historische Datenpunkte $\{z_t, x_t\}$ verfügbar und der Prognosehorizont betrage $h = 3$. Wie bestimmt die Kreuzvalidierung in diesem Fall die optimalen Trendpunkte? Grafik \ref{fgk5034123} veranschaulicht das Prinzip.

\begin{figure}
  \includegraphics{viz_sw}
  \caption{\onehalfspacing Illustration der Methode für die Fixierung der Trendpunkte anhand eines univariaten Beispiels. Hier sind insgesamt $n = 10$ Beobachtungen verfügbar, und für jedes Sample-Fenster werden $d_a = 5$ Beobachtungen verwendet, um den Parameter $\beta_z$ gemäss Gleichung \eqref{zhj986945} zu schätzen. Von diesen fünf Beobachtungen werden wiederum jeweils die jüngsten $d_x = 3$ Beobachtungen genutzt, um die Schätzwerte $\hat{x}_{t_0 + k}$ für $k \leq h = 3$ zu erhalten. \label{fgk5034123}}
\end{figure}

Im Beispiel wird vereinfachend $d_a = 5$ festgelegt, sodass sich die Kreuzvalidierung auf die Extrapolation der erklärenden Variable $x_t$ beschränkt. Folglich werden zunächst die ältesten fünf Datenpunkte des gesamten Samples verwendet, um den Parameter $\beta_z$ von Gleichung \eqref{zhj986945} zu schätzen (siehe Sample-Fenster 1 in der Grafik). Im zweiten Schritt werden von diesen fünf Datenpunkten die jüngsten $d_x = 3$ Beobachtungen genutzt, um die als unbekannt behandelten $x_t$ für die Perioden sechs, sieben und acht zu schätzen (für den Moment ist die konkrete Wahl von $d_x$ arbiträr). Diese Schätzungen, gemeinsam mit dem im ersten Schritt gewonnen Schätzwert $\hat{\beta}_z$, implizieren dann wiederum Projektionen $\hat{z}_t$ für die Perioden sechs bis acht, welche mit den tatsächlichen Realisationen $z_t$ verglichen werden. Insbesondere kann eine Fehlermetrik bestimmt werden, welche die beobachteten und projizierten Zahlen gemeinsam auf eine «Abweichungsquantität» abbildet. Auf diese Weise werden drei $k$-Schritt Fehler für $k \in \{1, 2, 3\}$ abgeleitet (graues, hellgrünes und dunkelgrünes Feld in der Grafik), welche die Qualität der Modellprojektionen für zunehmend lange Horizonte bemessen. Der Aspekt des «Schiebefensters» kommt nun zum Tragen, indem diese Übung wiederholt wird: das Sample-Fenster und die Projektionsjahre werden um eine Periode nach rechts verschoben (siehe Sample-Fenster 2 in der Grafik), und die Prozedur erneut durchgeführt. Dies wird solange wiederholt, bis die äusserste Projektionsperiode des Sample-Fensters mit dem Ende des Samples übereinstimmt. Dies geschieht in diesem Fall in Sample-Fenster 3, wo die 3-Schritt-Prognose in der zuletzt verfügbaren Periode zehn stattfindet.

In diesem Beispiel generiert die Schiebefenster-Kreuzvalidierung jeweils drei Schätzwerte für den 1-, 2- und 3-Schritt Prognosefehler des Modells. Die jeweiligen $k$-Schritt-Fehler werden nun über die Sample-Fenster hinweg gepoolt, um konsolidierte Schätzer für die Prognosefähigkeit des Modells über die verschiedenen Zeithorizonte zu erhalten. Ein solches Pooling kann beispielsweise durch einen arithmetischen Mittelwert erfolgen. Die drei gepoolten $k$-Schrittfehler werden daraufhin wiederum gemittelt, um zu einer globalen Präzisions-Metrik zu gelangen. Eine Wiederholung dieses Verfahrens für alternative Werte von $d_x$ -- in diesem Fall sind Werte von 2 bis 5 möglich -- erlaubt so einen Vergleich, wie die Leistung des Modells mit den Trendpunkten variiert. Schlussendlich werden diejenigen Trendpunkte gewählt, die den globalen Fehler minimieren.

Um das Verfahren auf das Basismodell zu übertragen sei
\begin{equation}
e_k(w, \boldsymbol{d}) \equiv \epsilon\left(\hat{z}(w, \boldsymbol{d})_{t_0(w) + k}, z_{t_0(w) + k}\right)
\end{equation}
die Funktion, welche einen prognostizierten gegenüber einem historischen Wert in Abhängigkeit der Trendpunkte $\boldsymbol{d}$ und einem Sample-Fenster
$w$ auf eine Fehlerbemessung abbildet. Hierbei ist $\epsilon$ eine festzulegende Abbildung und $t_0(w)$ das kontrafaktische Jahr der Prognoseerstellung, welches mit dem Sample-Fenster variiert. Zusätzlich bezeichnet $1 \leq k \leq h$ die Anzahl Jahre über $t_0(w)$ hinaus, für welche projiziert wird. Sei $n_w$ die Anzahl verwendeter Sample-Fenster, welche implizit durch die Sample-Grösse $n$ und den maximalen Eintrag in
$\boldsymbol{d}$ fixiert wird, und $\boldsymbol{d}^*$ der schlussendlich gewählte Vektor von Trendpunkten. Zudem wird ein Diskontierungsfaktor benötigt, welcher aus den historischen LIK-Teuerungsraten $\iota_t$ abgeleitet wird:
\begin{equation} \label{vlfk3094jg3}
	\delta_k(w) \equiv 1 \big / \Big( \prod\nolimits_{t = t_0(w) + 1}^{t_0(w) + k} \big(1 + \iota_t + 0.02\big) \Big), \quad 1 \leq k \leq h
\end{equation}
Für das Basismodell (Stand Mai 2025) gelten nun folgende Annahmen:
\begin{align}
  e_k(w,\boldsymbol{d}) & \equiv \delta_k(w) \times \left|\hat{z}(w, \boldsymbol{d})_{t_0(w) + k} - z_{t_0(w) + k} \right| \label{ufh29843h23}\\
  e_k(\boldsymbol{d}) & \equiv \sum\nolimits_w e_k(w, \boldsymbol{d}) / n_w \label{fij43029432}\\
  e(\boldsymbol{d}) & \equiv \sum\nolimits_{k = 1}^h e_k(\boldsymbol{d}) / h \label{lrej0429u234}\\
  \boldsymbol{d}^* & \equiv \arg\min\nolimits_{\boldsymbol{d}} e(\boldsymbol{d})
\end{align}
Die spezifische Wahl von \eqref{ufh29843h23} reflektiert die empirisch begründete Annahme, dass sich die Anlagen des AHV-Fonds real mit zwei Prozent pro Jahr verzinsen. Die Abdiskontierung nach \eqref{vlfk3094jg3} bewirkt somit, dass zukünftige Ausgaben aufgrund der unterstellten Renditeerwartungen zunehmend schwächer gewichtet werden: je früher ein Projektionsfehler auftritt, desto schwerer wiegt er, da er sich über einen längeren verbleibenden Projektionshorizont verzinsen kann. Auf diese Weise ist das Basismodell implizit auf die Projektion des AHV-Fondsstands optimiert. Abgesehen von dieser Logik ist die absolute Abweichung vom realisierten Wert zudem auch ein leicht zu interpretierendes Fehlermass.
Die Ergebnisse sind nach internen Analysen nicht übermässig sensitiv gegenüber alternativen Metriken, wie beispielsweise der relativen statt absoluten Projektionsabweichung. Neben anderen Fehlermetriken sind auch verschiedene Pooling-Verfahren für die geschätzten $k$-Schritt Fehler denkbar. Beispielsweise könnte anstatt einem arithmetischen Mittelwert in \eqref{fij43029432} und \eqref{lrej0429u234} eine geometrische Mittelung vorgenommen werden. Hierbei stellt sich ebenfalls in Tests heraus, dass die Wahl anderer Mittelwert-Funktionen keinen grossen Einfluss nimmt.

Derzeit werden für die individuellen Trendpunkte Werte im Bereich von vier bis sechs zugelassen (womit insgesamt 81 Kombinationen verglichen werden). Diese Einschränkung reflektiert einerseits die limitierte Datenverfügbarkeit, da die jährlichen AHV-Gesamtausgaben vor 2005 aufgrund der nachgelagerten Auswirkungen der 10. AHV-Reform für Validierungszwecke problematisch sind.\footnote{\onehalfspacing Technisch gesehen wurde eine Bruchpunktanalyse durchgeführt, welche prüft, innerhalb welcher Zeiträume sich die jährlichen Veränderungen der AHV-Gesamtausgaben statistisch ähnlich verhalten. Genutzt wird dazu die Funktion \textsf{breakpoints} im R-Paket \textsf{strucchange}, welche 2005 als Startjahr eines stabilen Zeitraums identifiziert (siehe \citet{struc2002}).} Andererseits werden mindestens vier historische Datenpunkte zur Extrapolation benötigt, da ansonsten die Schätz-Unsicherheit der Projektionen eskaliert (mehr dazu später). Zudem werden die verwendeten Sample-Fenster über die verschiedenen Trendpunkt-Konstellationen konstant gehalten, um einen konsistenten Vergleich zu sichern. Folglich fixiert das Maximum über die zugelassenen Werte für die einzelnen Trendpunkte die in der Kreuzvalidierung verwendeten Daten für alle verglichenen Parameter.


\subsection{Gesetzesreformen}

Mit den extrapolierten Rentenbeständen und -durchschnittshöhen als Funktion der optimierten Trendpunkte können die AHV-Gesamtausgaben anhand von \eqref{f4oijf20934r2} projiziert werden. Zuvor sind allerdings noch drei Modifikationen vorzunehmen, um gewissen Gesetzesänderungen Rechnung zu tragen.

\begin{outline}
  \1[1.] Ab dem Jahr 2026 wird eine 13. AHV-Altersrente ausgezahlt. Folglich werden die projizierte Altersrentensumme ab diesem Zeitpunkt mit $13/12$ skaliert. Zusätzlich wird berücksichtigt, dass die Auszahlung der 13. Rente gemäss dem sogenannten Liechtensteiner-Modell ausschliesslich im Dezember erfolgt. Dabei erhalten Verrentete, die unterhalb des Jahres erstmals eine Altersrente beziehen, entsprechend nur eine anteilige Dezemberauszahlung. Rentenbeziehende, welche während des Jahres versterben, erhalten hingegen keinerlei Zuschlag \textit{post mortem}. Diese Asymmetrie erzeugt gewisse Einsparungen, welche anhand von unterjährlichen Todesfällen und deren Rentensummen abgeschätzt werden. Details zum Ansatz sind nicht Bestandteil des Methodenbeschriebs oder der Programm-Code Kommentare, aber werden auf Anfrage bereitgestellt.

  \1[2.] Die Auswirkungen der Reform AHV 21 müssen berücksichtigt werden, welche das Referenzalter der Frauen ab 2025 in Schritten von drei Monaten sukzessive auf 65 Jahre anhebt. Zugleich sieht die Reform Kompensationsmassnahmen für die weiblichen Übergangskohorten der Jahrgänge 1961-1969 vor. Die schrittweisen Referenzaltererhöhungen werden im Basismodell direkt abgebildet. Zu diesem Zweck werden die berechneten historischen Rentenbezugsquoten nach Alter im Gleichschritt mit den Referenzaltererhöhungen «nach hinten» verschoben. Das heisst, dass beispielsweise im Jahr 2028, wenn das Zielreferenzalter von 65 erreicht wird, per Annahme derselbe Anteil von 65-jährigen Frauen eine Altersrente bezieht wie die 64-jährigen gemäss der berechneten Bezugsquoten. Die Ausgleichsmassnahmen hingegen finden auf einem Detailgrad statt, welchen das Basismodell nicht abbilden kann. Deshalb wird hier auf die Berechnungen eines komplexeren, kohorten-basierten Modells zurückgegriffen, welche den Projektionen des Basismodells \textit{ex post} aufgeschlagen werden. Der \textsf{R}-Code zur Berechnung dieses Aufschlags ist auf Anfrage erhältlich.
  \1[3.] In Folge eines Urteils des Europäischen Gerichtshofs für Menschenrechte im Herbst 2022 wurden die Anspruchsbedingungen für Witwerrenten übergangsweise angepasst. Aus diesem und anderen Gründen wird deshalb ein komplementäres Modell verwendet, um die Bestände und Durchschnittshöhen der Verwitwetenrenten zu projizieren. Der Beschrieb dieses Modells findet sich im Appendix.
\end{outline}

Damit ist die Erstellung der Referenzprojektion der AHV-Gesamtausgaben umrissen. Abschliessend wird erläutert, wie diese «mittlere» Projektion mit einer Abschätzung ihrer Unsicherheit ergänzt wird.

\section{Ausgaben-Szenarien}

Der Szenarien-Ansatz des Basismodells stützt sich sowohl auf quantiative wie auch qualitative Methoden. Der quantitative Anteil beziffert, inwiefern die multiplikativ interagierenden Trend-Schätzungen zur Projektionsunsicherheit beitragen. Qualitative Aspekte, unter anderem in der Form von Narrativen über zukünftige Strukturbrüche in Zeitreihen, finden Eingang durch die alternativen BFS-Bevölkerungsszenarien «Hoch» (B-00-2025) und «Tief» (C-00-2025).

Die quantitative Bemessung der Unsicherheit basiert auf der Grundannahme, dass die Störterme in den respektiven Schätzgleichungen normalverteilt sind. Als Konsequenz dieser Normalverteilungs-Annahme, und gegeben eines fixierten Demografie-Szenarios, folgen die Prognosen der Rentenbestände und -durchschnittshöhen aus den OLS-Fits sogenannten Lage-Skalen-Familien von Studentschen $t$-Verteilungen (siehe zum Beispiel \citet{montgomery2021introduction}, Abschnitt 2.10, für Herleitungen dieses Standardresultats und anderen, noch folgenden Ergebnissen). Zur Illustration wird nun angenommen, ein prädiktives Intervall für die Beobachtung einer generischen Zufallsvariable $z_t$ in der Periode $t > t_0$ sei gefragt. Die Standardabweichung einer beliebigen Zufallsvariable $v$ wird im Folgenden mit $\sigma_v$ bezeichnet. In Anlehnung an Gleichung \eqref{zhj986945}, und unter einem gewissen Missbrauch von Notation, gilt für eine univariate Regression ohne Achsenabschnitt
\begin{align} \label{239r03j2323r}
	  & (z_t - \hat{z}_t) / \hat{\sigma}_{z_t} =_d \textsc{Student}_{n - 1} \nonumber \\
	\implies\quad & z_t =_d \hat{\beta}_z \times x_t + \hat{\sigma}_{\varepsilon_z} \times \bigg( 1 + \frac{x_t^2}{\sum_{k \leq t_0} x_k^2} \bigg) \times \textsc{Student}_{n-1}.
\end{align}
Die Verteilungsgleichung zeigt auf, weshalb mindestens vier Punkte zur Extrapolation der jeweiligen Zeitreihen verwendet werden sollten. Der Grund ist, dass erstens durch die Schätzung in ersten Differenzen eine Beobachtung verloren geht, und zweitens die Schätzung des Parameters $\beta_z$ einen statistischen Freiheitsgrad verbraucht. Folglich würde bei einem Sample von drei Beobachtungen die standardisierte Differenz in der ersten Zeile von \eqref{239r03j2323r} einer $t$-Verteilung mit genau einem Freiheitsgrad folgen, welche synonym ist zur Cauchy-Verteilung. Die Cauchy-Verteilung besitzt keine endlichen (ganzzahligen) Momente, und diese Eigenschaft bleibt unter Lage-Skalen Transformationen erhalten. Folglich geht die Interpretation der Prognosen als konditionale Erwartungswerte verloren, was die Einschränkung der Trendpunkte auf den Mindestwert vier während der Kreuzvalidierung rechtfertigt.

Aus der Implikation \eqref{239r03j2323r} lassen sich nun die prädiktiven Verteilungen der zukünftigen AHV-Gesamtausgaben ableiten. Dazu werden zunächst separat die prädiktiven Verteilungen der geschätzten jährlichen Veränderungen der ausländischen Rentenbestände, der Durchschnittsrenten im In- und Ausland sowie der Gesamtausgaben \textit{gegeben} der Rentensumme als erklärender Variable nach obigem Muster abgeleitet. Aus diesen Verteilungen der Rentensummen-Komponenten kann nun die prädiktive Verteilung der Gesamtausgaben \textit{ohne} Konditionierung auf die Rentensumme bestimmt werden (heisst, es wird nun berücksichtigt, dass die erklärende Variable in . Da die Rentensumme jedoch selbst eine Zufallsvariable darstellt, welche wiederum aus einer Summe von (Produkten von) Zufallsvariablen besteht, folgen die geschätzen unkonditionalen Gesamtausgaben \textit{nicht} einer Lage-Skalen $t$-Verteilung. Mit Bezug auf die in \eqref{f4oijf20934r2} eingeführte Notation der synthetischen Renten lässt sich die geschätzte erklärende Variable schreiben als
\begin{equation}
  \hat{x}_t = \Delta \Big( \widehat{\#}_{t} \times (\widehat{\varnothing_{t} / m_t}) \Big ).
\end{equation}
Eine geschlossene Form der Verteilung der projizierten AHV-Ausgaben, konditional auf die vom Bevölkerungsszenario unterstellte demografische Entwicklung im Inland, ist demnach nicht verfügbar. Da jedoch sowohl die prädiktive Verteilung der auf die Rentensumme konditionieren Gesamtausgaben bekannt ist als auch diejenigen der Komponenten der Rentensumme -- siehe die vorherige Herleitung -- kann die Verteilung der Ausgaben-Projektionen durch Simulationen berechnet werden. Dazu wird zunächst für alle erklärenden Zufallsvariablen eine Beobachtung aus der relevanten Sampling-Verteilung gezogen, heisst, genau eine Ziehung für die jeweiligen ausländischen Rentenbestände sowie die Durchschnittsrenten des Jahres von Interesse. Anschliessend werden diese Ziehungen gemeinsam auf die Rentensumme in \eqref{f4oijf20934r2} abgebildet, und durch Ziehungen von $\hat{\beta}_a$ sowie $\hat{\varepsilon}_{a_t}$ ergänzt (deren Verteilungen ebenfalls bekannt sind). Daraus resultiert eine Realisation von $\hat{a}_t$. Dieses Verfahren wird nun 20'000 mal wiederholt, um die Sampling-Verteilung der Ausgaben-Projektion des Jahres $t$ zu berechnen.

Die so gewonnene Sampling-Verteilung ist wie bereits erwähnt auf eines der drei Demografie-Szenarien konditioniert. Zur Konstruktion der finalen Unsicherheitsbändern ist dabei die Konditionierung auf das hohe Szenario (mehr Ausgaben) und das niedrige Szenario (weniger Ausgaben) von Interesse. Konkret wird der Adjustierungsprozess, welcher im Zusammenhang mit Gleichung \eqref{4eofjr409j} erläutert wurde, wie folgt angepasst. Zuerst wird das vom BFS bereitgestellte Bevölkerungsszenario «hoch» (B-00) unterstellt, welches ein grösseres Bevölkerungswachstum und niedrigere Mortalitäten unterstellt als das Referenzszenario, und alle erklärenden Variablen neben den inländischen Rentenbeständen werden wie bereits beschrieben projiziert bzw. gesampled. Dies ergibt ein prädiktives Band für die zukünftigen jährlichen AHV-Ausgaben konditional auf die Realisierung des hohen Bevölkerungsszenarios. Im zweiten Schritt werden auf die gleiche Weise Prädiktionsbänder konditional auf die Realisierung des «niedrigen» Szenarios C-00 berechnet. Gegeben eines Konfidenzniveaus für diese konditionalen prädiktiven Bänder -- momentan wird das übliche Niveau von 90\% verwendet -- werden nun die Maxima der jahresweisen Bänder der ersten Kalkulation und die Minima der Bänder der zweiten Kalkulation fixiert. Zusammen mit der Referenzprojektion unter dem «mittleren» Szenario A-00 resultieren so drei Zeitreihen, welche wir respektive als «mittleres», «hohes» und «niedriges» Szenario bezeichnen. Aus Gründen der Technik und des Aufwands werden Szenario-bedingte Variationen des Liechtenstein-Spareffekts, der Verwitwetenrenten (siehe den Modellbeschrieb im Appendix) sowie der exogenen Berechnungen der AHV 21 Auswirkungen (ohne Referenzaltereffekt) nicht berücksichtigt.

Es ist anzumerken, dass die so abgeleiteten Unsicherheitsbänder keine Interpretation im Sinne von Konfidenzintervallen besitzen. Obwohl die prädiktiven Intervalle konditional auf ein Bevölkerungsszenario diese Lesart erlauben, überträgt sich diese nicht auf das finale Produkt. Der Grund ist, dass den BFS-Szenarien keine Eintrittswahrscheinlichkeiten zugrundeliegen. Das verhindert eine Konsolidierung der konditionalen Bänder im statistischen Sinne (weshalb sich auch eine Berechnung der prädiktiven Bänder konditional auf das Bevölkerungsszenario A-00 in diesem Ansatz erübrigt). Stattdessen sind die berechneten hohen und niedrigen Ausgaben-Pfade als «worst» bzw. «best» case Ergebnisse zu interpretieren, während die Referenzprojektion die erwartete Entwicklung unter der Fortsetzung historischer Trends repräsentiert. Während die Referenzprojektion dabei als der plausibelste Ausgang betrachtet wird, werden alle anderen Ausgaben-Pfade innerhalb der Unsicherheitsbänder bezüglich ihrer Plausibilität nicht unterschieden.

\section*{Appendix}
\addcontentsline{toc}{section}{Appendix}

\subsection*{Witwerrenten}

Das folgende Modell wurde entwickelt, um die Auswirkungen der geplanten Reform der AHV-Hinterlassenenrenten abzuschätzen. Als Teil davon wird auch die kommende Entwicklung der AHV-Witwen- und Witwerrenten gemäss geltendem Recht für die kommenden Jahre projiziert. Im Folgenden werden die dem Modell zugrundeliegenden Datensätze und deren Verwendung beschrieben:
\begin{outline}
\1 Die Rentenregister der 1. Säule der vergangenen fünf Jahre (2019-2023) werden verwendet, um einerseits den Anteil der Witwen- und Witwerrenten in der Schweiz $\alpha(g, a)$ nach Geschlecht $g$ und Altersgruppe $a$ zu bestimmen. Dabei werden nur die beiden Altersgruppen «vor dem Referenzalter» und «nach dem Referenzalter» unterschieden. Andererseits werden die durchschnittliche Rentenniveaus $r(g, a, w)$ relativ zur Minimalrente nach Geschlecht $g$, Altersgruppe $a$ und Wohnort $w$ (Schweiz/Ausland) berechnet. Während für die Witwenrenten alle vorhandenen fünf Jahre verwendet werden, basieren die Schätzungen der Witwerrenten (Bestand und Durchschnittshöhe) ausschliesslich auf den Daten des Jahres 2023. Der Grund dafür ist, dass sich der Anteil der Witwerrentenbeziehenden im Ausland insbesondere nach dem Referenzalter durch das Urteil des Europäischen Gerichtshofs für Menschenrechte (EGMR) im Herbst 2022 und die konsequente \textit{ad hoc} Massnahme massiv erhöht hat.\footnote{Siehe beispielsweise \url{https://www.bsv.admin.ch/bsv/de/home/sozialversicherungen/ahv/grundlagen-gesetze/witwerrente.html} für weitere Details.} Diese Erhöhung ist im Rentenregister allerdings erst ab 2023 sichtbar, und geht mit einer gleichzeitigen deutlichen Senkung der durchschnittlichen Rentenhöhe einher.

\1 Aus den Individualdaten des STATPOP-Datensatzes der Jahre 2017-2021, verknüpft mit Angaben aus den Rentenregistern der 1. Säule, wird einerseits die Anzahl Todesfälle in der Schweiz in diesen fünf Jahren $D_{0}(h, y)$ nach Geschlecht $h$ und Alter $y$ berechnet, und andererseits die Anzahl Witwen- und Witwerrenten, die durch diese Todesfälle ausgelöst worden wären, wenn die \textit{ad hoc} Massnahme im Nachgang des EGMR-Urteils bereits rechtsgültig gewesen wäre. Konkret werden zu den Witwen- und Witwerrenten aus den Rentenregistern die noch nicht pensionierten Witwer mit Kindern über 18 Jahren hinzugezählt. Die Anzahl dieser durch die Todesfälle 2017-2021 in der Schweiz ausgelösten Witwen- und Witwerrenten werden aufgeteilt nach den vier Dimensionen Geschlecht $g$ und Alter $x$ der hinterbliebenen Person sowie Geschlecht $h$ und Alter $y$ der verstorbenen Person berechnet: $N_{0}(g, x, h, y).$ Die beiden Lebensalter $x$ und $y$ beziehen sich dabei auf das Jahr des relevanten Todesfalls.

\1 Für die Projektion werden die Daten des BFS-Referenzszenarios «A-00-2020» verwendet. Konkret fliessen die Anzahl erwarteter Todesfälle in der Schweiz $D_{t}(h, y)$ nach Kalenderjahr $t$, Geschlecht $h$ und Alter $y$ in die Berechnungen, sowie die prospektiven Sterbewahrscheinlichkeiten $q_{t}(g, x)$ nach Kalenderjahr $t$, Geschlecht $g$ und Alter $x$.
\end{outline}

Die Entwicklung des Bestandes an Witwen- und Witwerrenten in der Schweiz wird aus diesen Daten nach einer Standardprozedur abgeleitet. Zunächst ist der Bestand Ende Jahr gleich dem Bestand Ende Vorjahr plus die Zugänge minus die Abgänge:
\begin{equation}
H_{t}(g, x) = H_{t-1}(g, x-1) + N_{t}(g, x) - E_{t}(g, x)
\end{equation}
Dabei werden die Zugänge aus den erwarteten Todesfällen und den historischen Informationen gemäss STATPOP geschätzt via
\begin{equation}
N_{t}(g, x) = \sum\nolimits_{h,y}N_{0}(g, x, h, y)\frac{D_{t}(h, y)}{D_{0}(h, y)},
\end{equation}
und die Abgänge werden anhand der Sterbewahrscheinlichkeiten und einem Faktor $f(g, x)$ ermittelt, der die spezielle Situation beim Übergang ins Rentenalter erfasst:
\begin{equation}
E_{t}(g, x) = H_{t-1}(g, x-1)\big(1 - (1 - q_{t}(g, x))(1 - f(g, x))\big).
\end{equation}
Bei Erreichen des Referenzalters wird die Witwen- oder Witwerrente meistens durch eine Altersrente abgelöst, da diese in der Regel höher liegt. Gemäss Berechnungen aus historischen Daten betrifft dies in der Schweiz ungefähr 87\% der Witwenrenten und 90\% der Witwerrenten. Daraus folgen $f(g, x) = 0$ für alle $x \ne 65$, $f(\textit{Frau}, 65) = 0.87$ und $f(\textit{Mann}, 65) = 0.90$. Aus dem Rentenregister 2023 ist $H_{2023}(g, x)$ ablesbar. Damit ist alles zur Hand, um das beschriebene Verfahren für $t \geq 2024$ im Inland anzuwenden.

Sei $\mathcal{A}$ die Menge der betrachteten Altersgruppen. Die Witwen- und Witwerrenten im Ausland rechnen wir pauschal mittels dem aus den Rentenregistern bestimmten Anteil hinzu:
\begin{equation}
  H_{t}(g, a, \textit{Ausland}) = \sum\nolimits_{x \in \mathcal{A}}H_{t}(g, x)\frac{1 - \alpha(g, a)}{\alpha(g, a)}
\end{equation}
Für die Schweiz entspricht dies einfach der Summe über die entsprechenden Alter $H_{t}(g, a, \textit{Schweiz}) = \sum_{x \in \mathcal{A}}H_{t}(g, x)$. Die durchschnittliche Witwen- und Witwerrente relativ zur Minimalrente nach Geschlecht und Wohnort berechnen wir als mit der Anzahl Renten gewichteten Durchschnitt der historischen Werte
\begin{equation}
r_{t}(g, w) = \sum\nolimits_{a}r(g, a, w)\frac{H_{t}(g, a, w)}{H_{t}(g, w)}.
\end{equation}

\bibliographystyle{plainnat}   % or abbrvnat, unsrtnat, etc.
\bibliography{doku_basismodell_bss} 

\end{document}
