BG BAU Berufsgenossenschaft der Bauwirtschaft

Rückwärts blättern Vorwärts blättern

3 Risikoquantifizierung im Bereich beobachteter Krebsinzidenzen

3.1 Auswahl von Tierspezies, Geschlecht und Tumorlokalisation(en)

(1) Liegen Tumordaten zu mehreren der üblicherweise eingesetzten Tierarten vor, so sind diejenigen zu der Tierspezies bevorzugt heranzuziehen, die am empfindlichsten reagiert.

(2) Bei der Auswahl der Tierspezies und der dort beobachteten Tumortypen und -lokalisationen ist jedoch abzuwägen, inwieweit eine quantitative Übertragbarkeit auf den Menschen angenommen werden kann. Eine Übertragbarkeit ist insbesondere dann anzunehmen, wenn die Tumorlokalisation im Speziesvergleich identisch ist und/ oder Erkenntnisse zum "mode of action" das Auftreten eines bestimmten Tumortyps (oder einer bestimmten Tumorlokalisation) stützen.

Tierexperimentelle Studien werden vor dem Hintergrund durchgeführt, dass qualitative und quantitative Übertragungen auf dem Menschen (ggf. unter Berücksichtigung von Extrapolations- oder Korrekturfaktoren) prinzipiell möglich sind. Insofern ist grundsätzlich das tierexperimentelle Modell mit der größten Verwandtschaft zum Menschen zu bevorzugen. Im Falle des Nichtwissens darüber, welches Tiermodell im speziellen Fall dem Menschen am nächsten steht, ist ein konservatives Herangehen der geeignete Maßstab. Dieses gilt grundsätzlich, auch wenn im Einzelfall Widersprüche aufgezeigt wurden: Bei 1,3-Butadien scheint der menschliche Metabolismus dem der weniger empfindlichen Ratte ähnlicher zu sein als dem der empfindlicheren Maus. Werden jedoch epidemiologische und tierexperimentelle Risikoquantifizierungen gegenübergestellt, ist bei 1,3-Butadien eine größere Übereinstimmung des Krebsrisikos für Maus und Mensch zu beobachten (Roller et al., 2006). Dieser mögliche Widerspruch im Falle von 1,3-Butadien bedeutet, dass

  1. den Humandaten besonderes Gewicht zuzumessen ist (siehe Nummer 1.5 Abs. 1),
  2. konservative Extrapolationsschritte wie die Annahme von Linearität im Niedrigrisikobereich nicht vorschnell wegen vermeintlicher mechanistischer Hinweise aufgegeben werden sollten, und
  3. die relative Empfindlichkeit von Versuchstieren gegenüber dem Menschen weiterer Überprüfung bedarf.

(3) Eine im Tierexperiment beobachtete Tumorlokalisation, die von den Beobachtungen aus epidemiologischen Studien beim Menschen abweicht, spricht in der Regel nicht gegen deren Humanrelevanz (siehe aber Hinweis unter Nummer 3.1 Abs. 6). Die resultierende Risikoquantifizierung ist jedoch als unsicherer zu betrachten.

(4) Liegen erhöhte Tumorinzidenzen in beiden Geschlechtern vor, so sind in der Regel die Daten zu jenem Geschlecht mit der höheren Tumorrate heranzuziehen. Liegen die Tumorraten in beiden Geschlechtern etwa in gleicher Höhe, so ist zur Erhöhung der statistischen Absicherung eine Addition der Daten zu beiden Geschlechtern zulässig.

(5) Liegen Tumore in mehreren Organen vor, so sind die Daten zu allen den Organen heranzuziehen, bei denen eine statistisch und/ oder biologisch erhöhte Tumorenzahl in einer Dosierung beobachtet wird, und/ oder eine statistisch signifikante Dosis-Wirkungsbeziehung (ggf. auch nur als Trend) erkennbar ist.

Es gibt eine Reihe typischer Tumorformen, die in bestimmten Nagerstämmen mit hoher, teilweise auch stark variabler Spontaninzidenz auftreten und deren Relevanz für den Menschen nicht feststeht (siehe Nummer 3.1 Abs. 6). Wenn deren Häufigkeit dosisabhängig gegenüber der aktuellen und der mittleren historischen Kontrolle erhöht ist, wird man in der Regel von einem expositionsbedingten Effekt sprechen.

Zunächst ist zu prüfen, ob nicht auch andere Tumorformen aufgetreten sind, die keinesfalls der Spontanpathologie zugeordnet werden können und ob diese nicht bei noch niedrigerer Dosis und/ oder in größerer Häufigkeit aufgetreten sind und allein schon aus diesem Grunde als Berechnungsgrundlage vorgezogen werden sollten.

(6) Die Berücksichtigung oder Nichtberücksichtigung bestimmter Tumorlokalisationen (ggf. mit Einschränkung auf bestimmte Tierspezies oder –stämme) stellt eine Einzelfallabwägung dar. Als Hinweise für die Frage der (qualitativen und/ oder quantitativen) Übertragbarkeit auf den Menschen gelten:

  • Es ist keine (qualitative oder quantitative) Ubertragbarkeit anzunehmen: alpha-2u-globulinbedingte Nierentumoren der mannlichen Ratte.
  • In der Regel nur qualitativ (nicht quantitativ) übertragbar, wenn auch zugleich Gentoxizität vorliegt (in der Regel auch nicht qualitativ übertragbar, wenn keine Gentoxizität vorliegt): Lebertumoren nach PPARα-Rezeptor-Stimulation ("Pero-xisomenproliferation"), Leukämien bei Fischer-344-Ratte, Phäochromocytome, wenn diese nur bei mannlicher F344-Ratte auftreten, Vormagentumoren und Tumoren der Zymbal-, Harderschen Drüse sowie Klitoris- und Präputialdrüse, wenn außer an diesen Lokalisationen keine Tumoren in anderen Lokalisationen auftreten.

    Der rein qualitative Speziesvergleich ist fur Einstufungen relevant, jedoch nicht für die hier betrachtete Ermittlung einer Expositions-Risiko-Beziehung und einer Konzentration in Bezug auf eine bestimmte Risikozahl.
  • In der Regel quantitativ übertragbar, wenn zugleich Gentoxizität vorliegt, jedoch mit erhöhter Unsicherheit (d. h. in der Regel nur qualitativ übertragbar, wenn keine Gentoxizität vorliegt): Leydigzelltumoren bei Nagern, Lebertumoren bei B6C3F1-Maus, Phäochromocytome bei F344-Ratte, wenn diese in beiden Geschlechtern auftreten (Differenzialdiagnostik zu – altersbedingten – Hyperplasien beachten, Daten zu weiblichem Tier für Quantifizierung geeigneter), Schilddrüsentumoren bei der Ratte, Vormagentumoren und Tumoren der Zymbal-, Harderschen Drüse sowie Klitoris- und Präputialdrüse, wenn außer an diesen Tumorlokalisationen zugleich Tumoren in anderer Lokalisation auftreten.
  • Auch ohne Gentoxizität quantitativ in der Regel übertragbar, teilweise jedoch mit erheblichen Unsicherheiten: alle anderen Lokalisationen und Tumorarten, Tumoren bei anderen als den genannten Tierspezies oder -stämmen.
  • Bei der Abwägung, ob eine quantitative Übertragbarkeit angenommen wird, ist die (beobachtete oder zu unterstellende) Konzentration der Substanz am Zielorgan einzubeziehen.
  • Bei der Abwägung, ob eine quantitative Übertragbarkeit angenommen wird, ist das zu unterstellende Wirkprofil (siehe Nummer 2) einzubeziehen
  • Liegen sowohl Tumorinzidenzen an
    1. Lokalisationen mit fraglicher Humanrelevanz und/ oder fraglicher quantitativer Übertragbarkeit vor und an
    2. Lokalisationen mit eindeutigerer quantitativer Übertragbarkeit, so ist letzteren in der Regel der Vorzug bei der Risikoquantifizierung zu geben.


    Eine ausführlichere Diskussion zum Hintergrund dieser Differenzierung befindet sich in Anhang 10.3 dieses Leitfadens (mit Literaturhinweisen).

(7) Die Tumorinzidenzen in den verschiedenen Organen, die unter (5) und (6) ausgewählt wurden, sind in der Regel getrennt zu quantifizieren und vergleichend gegenüberzustellen. Die Risikoquantifizierung erfolgt im Standardfall mit derjenigen Tumorlokalisation mit der niedrigsten T25, d. h. eine Dosis oder Konzentration, bei der bei 25 Prozent der Tiere Krebs auftritt. Dabei wird die unterschiedliche Hintergrundrate bei der T25-Berechnung berücksichtigt. In Einzelfällen ist es jedoch geboten, auch verschiedene Tumorlokalisationen zusammenzufassen (Beispiel: Asbest – Mesotheliome, Lungentumoren). Im Falle, dass eine solche Zusammenfassung vorgenommen wird, ist die Maßgeblichkeit der Gesamtinzidenz für die Risikoquantifizierung zu begründen.

Bei T25-Verfahren wird ausgehend von einer Konzentration mit signifikant erhöhter Tumorinzidenz durch lineare Interpolation

  1. unter Berücksichtigung der Hintergrundinzidenz,
  2. gegebenenfalls unter Korrektur einer nicht lebenslangen Versuchsdauer, und
  3. unter Annahme einer vollständigen Resorption eine Dosis ermittelt, bei der die Inzidenz für diesen Tumor im Tierversuch 25 Prozent bei lebenslanger Exposition beträgt (vgl. auch Glossar)

Mit der Berechnung von T25 oder BMD für mehrere Tumorlokalisationen, Geschlechter sowie mit und ohne gutartige Tumoren soll ermöglicht werden, in späteren Schritten parallel von mehreren "points of departure" (siehe Nummer 3.2) aus und verknüpft mit einer differenzierten mechanistischen Diskussion in den Niedrigrisikobereich zu extrapolieren. Aggregationen (Zusammenfassungen von Befunden) sind insbesondere dann sinnvoll, wenn die Frage der Differenzierung verschiedener Dosis-Wirkungsbeziehungen (z. B. wegen der Homogenität der beobachteten Reaktionen) nicht im Vordergrund steht. So kann es sinnvoll sein, die Befunde bei einer einheitlichen Wirkungsweise eines Kanzerogens in verschiedenen Organen auch über verschiedene Tumorlokalisationen zu aggregieren. Im TGD der EU wird ausgeführt: "For a substance inducing more than one type of tumours, the determination of a dose-descriptor value is from each relevant tumour type rather than from the number of tumour bearing animals. If several relevant data sets on tumour-incidences are available, dose descriptors values should be derived for all these." (EC 2006, Abschnitt 4.14.2.3). Verschiedene Hintergrundraten von Tumoren in verschiedenen Organen sprechen gegen eine Aggregation mehrerer Tumorlokalisationen.

Für eine differenziertere Betrachtung der Möglichkeiten zur Zusammenordnung von Tumoren für die Krebsrisikoberechnung argumentieren McConnell et al. (1986). EPA interpretiert diese Auswertung: "The incidence of benign and malignant lesions of the same cell type, usually within a single tissue or organ, are considered separately and are combined when scientifically defensible" (Eine konkrete Auflistung, wann Zusammenordnungen vorgenommen werden können, wird in McConnell et al. gegeben).

Es wird also nicht das Prinzip vertreten, die Gesamtzahl der tumortragenden Tiere, gleich welcher Tumorlokalisation, aufzuaddieren.

Manche ältere Studien waren auch so angelegt, dass nur verdächtige Zielorgane ausgewertet wurden. Entsprechend selektive Studien können dennoch für die Risikoquantifizierung herangezogen werden, wenn sie kanzerogene Wirkungen erkennen lassen. Mehrfach-Tumoren (Multiplizität) werden üblicherweise zusätzlich berichtet, wenn sie beobachtet werden.

(8) Liegen in einem Organ/ Gewebe mehrere Tumortypen vor, so ist in der Regel eine gemeinsame Betrachtung zu wählen. In begründeten Einzelfällen (z. B. Humanrelevanz nur eines Tumortyps) ist jedoch eine getrennte Betrachtung angezeigt.

(9) Liegen in einem Organ gutartige und bösartige Tumoren vor, so wird deren Inzidenz in der Regel addiert. Eine Addition verschiedener Tumortypen in einem Tier erfolgt jedoch nicht, da sonst eine Überschreitung der Gesamtinzidenz (bezogen auf das Organ > 100 Prozent) eintreten kann. Liegen Hinweise darauf vor, dass z. B. eine Malignisierung eines gutartigen Tumors beim Menschen unwahrscheinlich ist, kann begründet auf eine entsprechende Addition verzichtet werden.

3.2 Auswahl eines "point of departure"

(1) Der "point of departure" (POD; ein Ausgangspunkt für weitere Schritte der Risikoabschätzung) ist eine definierte Expositionshöhe mit Risikozuordnung auf der Konzentrations-Risiko-Funktion für eine Substanz. Der POD liegt auf oder nahe bei der Expositionshöhe (Konzentrationsbereich), zu der aus epidemiologischen oder aus tierexperimentellen Beobachtungen Daten über das Auftreten von Krebshäufigkeiten vorliegen. Für den POD wird das Risiko als Krebsinzidenz in Prozent der zugehörigen Konzentration (mg/m3) gegenübergestellt. Der POD ist ein normalisierter Wert. Unter "Normalisierung" ist die Umrechnung auf Lebens(arbeits-)zeitexposition (siehe Nummer 4.3), die Pfad-zu-Pfad-Extrapolation auf den Inhalationspfad (siehe Nummer 4.2) und die Berücksichtigung der Hintergrundinzidenz (siehe Nummer 3.4) in der vorgegebenen Weise zu verstehen. Der POD dient als Startpunkt für eine Extrapolation oder zu Vergleichszwecken; somit ist der T25 je nach Vergleichsebene bereits als Humanäquivalent anzugeben (hT25) oder auf der Ebene des Tierexperiments zu nutzen. Die Randbedingungen der Anwendung eines T25 sind jeweils präzise auszuweisen.

(2) Bei hinreichender Qualität der Beobachtungsdaten ist der POD als "Benchmark-Konzentration" bzw. Benchmark-Dosis auszuweisen. Dabei ist der zentrale Schätzwert (BMD) und nicht der 95-Prozent-Vertrauensbereich (BMDL)7 heranzuziehen.8 Der POD dient als Startpunkt für eine Extrapolation oder zu Vergleichszwecken; somit ist die Benchmark-Dosis je nach Vergleichsebene bereits als Humanäquivalent anzugeben (HBMD, HBMDL)9 oder auf der Ebene des Tierexperiments zu nutzen. Die Randbedingungen der Anwendung einer Benchmark-Dosis sind jeweils präzise auszuweisen.

Die Kriterien für eine ausreichende Qualität der Daten zur Modellierung nach dem Benchmark-Verfahren sind gesondert festzulegen (siehe Nummer 3.3). Der Faktor zwischen BMD und BMDL gibt auch eine Aussage zur Qualität der vorgenommenen Modellierung (Anpassungsgüte der Modellfunktion an die vorliegenden experimentellen Daten). Insofern kann bei Berechnung der BMDL dieser Faktor auch (neben anderen Kriterien) für die Beurteilung der Frage herangezogen werden, ob das Benchmark-Verfahren im konkreten Fall überhaupt zur Anwendung kommen sollte.

Die Auswahl des BMD statt des BMDL beinhaltet möglicherweise einen gewissen Fehler (da nicht ausgeschlossen werden kann, dass die Expositions-Risiko-Beziehung durch den BMDL korrekter beschrieben wird). Die Wahl des BMD erscheint jedoch begründet

  1. wegen der Analogie zum T25 bei schlechterer Datenlage (T25 ist ebenfalls ein zentraler Schätzwert ohne Vertrauensbereich),
  2. wegen des nur geringen möglichen Fehlers (bei großer Abweichung zwischen BMD und BMDL würde dies gegen die Verwendung des Benchmark-Verfahrens sprechen),
  3. da durch die Linearisierung im Bereich unterhalb der BMD als POD in den meisten Fällen ohnehin ein konservatives Extrapolationsverfahren gewählt wird.

Zur Umrechnung einer Benchmark-Dosis auf eine äquivalente Humanexposition siehe Nummer 4

(3) Die "benchmark response" beim POD ist aus Gründen der Vergleichbarkeit auf 10 Prozent zu setzen.

In vielen Fällen gibt es keine starken Abweichungen im angenommenen Risiko, wenn der T25 mit der BMD10 unter Korrektur (lineare Umrechnung) des Risikoniveaus verglichen wird (vgl. Anhang zu EC, Technical Guidance Document, 2006). Je nach Verlauf der Konzentrations-Risiko-Beziehung sind jedoch Abweichungen möglich. Deshalb und wegen der kompletteren Beschreibung des abgeleiteten Verlaufs der Konzentrations-Risiko-Beziehung im experimentellen Bereich wird der Anwendung des Benchmark-Verfahrens der Vorzug gegeben. Zu Beispielen siehe Nummer 5.2.

Eine Fortführung der Modellierung zwischen BMD10 und BMD0,1 wird im vorliegenden Leitfaden für den Fall einer mechanistisch begründeten Nichtlinearität bei guter Datenlage eingesetzt (siehe Nummer 5.2). Liegen keine hinreichenden Gründe für Nichtlinearität vor, so wird die Modellierung mit Benchmark-Methode nur für den experimentellen Bereich bis zu einer BMD10 als POD vorgenommen. In der früheren Vorgehensweise der U.S. EPA wurde das linearisierte Multistage- (LMS-) Modell herangezogen. Dieses Verfahren ist praktisch identisch mit einer Modellierung mit dem Multistage-Modell im experimentellen Bereich und der Fortführung der modellierten Funktion in den Niedrigrisikobereich (z. B. bei "benchmark response" 1:1000). Dabei wird jedoch der 95-Prozent-Vertrauensbereich einbezogen.


  1. Begrifflichkeit zum Benchmarkverfahren vgl. EPA, 2000
  2. Im Folgenden wird übergreifend von BMD ("Benchmarkdosis") oder BMDL gesprochen, auch wenn es sich in diesem Falle um Luftkonzentrationen (BMC, BMCL) handelt.
  3. Zur Bedeutung des Terminus Humanäquivalent und zur Umrechnung vgl. Abschnitt 4


(4) Ist die Ausweisung einer hinreichend qualifizierten Benchmark-Konzentration nicht möglich, ist die T25 in der Berechnung nach dem Verfahren von Sanner et al. (2001) / Dybing et al. (1997) als POD heranzuziehen.

Der T25 wird gegenüber ähnlichen anderen Werten als POD der Vorzug gegeben, wenn das Benchmark-Verfahren nicht eingesetzt werden kann, weil

  • dies dem Verfahren der Risikoquantifizierung in verschiedenen Festlegungen zum Risk Assessment der EU entspricht,
  • die in Deutschland früher diskutierte "Steinhoff"-Methode mit dem T25 als POD kompatibel ist, sie jedoch nicht auf einen normierten Prozentsatz (25 Prozent) bezogen ist,
  • die LED10 in den USA (EPA, 2005) die Anwendung des Benchmark-Verfahrens voraussetzt, was nicht immer hinreichend qualifiziert ist.

Das ED10-Verfahren der U.S. EPA basiert ebenfalls auf der Benchmark-Modellierung (ohne Berücksichtigung des Vertrauensbereichs) und ist methodisch identisch zur Ableitung der BMD10. Für die Berechnung eines Referenz-MoE (siehe Glossar "margin of exposure") nach EU/TGD wird in der Regel der Unterschied zwischen T25 und ED10 linear berücksichtigt, so dass in dem EU-MoE-Ansatz auch die ED10 als POD herangezogen werden kann.

(5) Für Extrapolationen in den Bereich unterhalb der beobachteten Inzidenzen, bei denen die Fortsetzung der Konzentrations-Wirkungs-Beziehung angenommen wird, wie diese im Beobachtungsbereich bereits vorliegt (stetige Funktion; siehe Nummer 5.2), ist die Angabe eines POD formal nicht erforderlich. Dieser sollte aber dennoch zu Vergleichszwecken ausgewiesen werden.

(6) BMD10 bzw. T25 sind für alle humanrelevanten Tumorlokalisationen zu errechnen (zur Auswahl der Tumorlokalisationen und Spezies siehe Nummer 3.1).

(7) Bei Benchmark-Modellierungen mit schlechterer Datenqualität (siehe Nummer 3.3) ist es sinnvoll, sowohl die Berechnung des T25 wie der BMD10 vorzunehmen, um die Auswirkungen der Unsicherheit der jeweiligen Entscheidung zu erkennen: ggf. liegen die nach den jeweiligen Verfahren ermittelten POD nahe beieinander oder zeigen deutliche Diskrepanzen. Die entsprechende Information ist zu dokumentieren.

Beispiele: siehe Nummer 5.2 (Fall B)

3.3 Mindestkriterien an Datenqualität für Anwendung des Benchmark-Verfahrens

(1) Zur Wahl des Benchmark-Verfahrens sollten in der Regel mindestens die Daten zur Kontrollgruppe und drei Dosisgruppen vorliegen.

In Annex XI zum TGD der EU wird anhand einiger Beispiele eine Abwägung zwischen T25 und BMD05 vorgenommen. Dabei wurde das genannte Kriterium hervorgehoben.

(2) Unterscheidet sich die Tumorhäufigkeit in allen Dosisgruppen nicht oder nur unwesentlich (Plateaueffekt), ist die Anwendung des Benchmark-Verfahrens nicht sinnvoll.

(3) Gibt es nur eine Dosisgruppe außer der Kontrolle, bei der die Effektstärke deutlich über der BMR7 liegt, ist das Benchmark-Verfahren nicht sinnvoll anwendbar.

(4) Liegt die Tumorhäufigkeit in nur 1 Dosisgruppe unter 100 Prozent Inzidenz (außer bei der Kontrolle), ist das Benchmark-Verfahren nicht sinnvoll anwendbar.

(5) Das Benchmark-Verfahren ist nicht anwendbar, wenn die Modellierung mit den vorliegenden Daten eine zu schlechte Anpassung erlaubt (Modellfit: p<0,1, Chi-Quadrat außerhalb -2 bis +2). Ferner ist die Unsicherheit der Abschätzung zu groß, wenn beim betrachteten BMR das Verhältnis BMD/BMDL >10 ist.

Im Abschlussbericht des Projekts FKZ 201 65 201/01 ("Vergleich der Verfahren zur Ableitung gesundheitsbezogener Wirkungsschwellen" Benchmark – NOAEL, Um-weltbundesamt 2003) werden die weiteren Kriterien 2–5 diskutiert und begründet.

(6) Für Zweifelsfälle mit begrenzter Datenqualität ist das Vorgehen nach Nummer 3.2 (7) zu wählen, nämlich zwischen T25 und dem Benchmark-Verfahren abzuwägen. Die Begründung für die Verfahrensweise ist zu dokumentieren.

Beispiel: siehe. Nummer 5.2 (Fall B)

3.4 Anwendung des Benchmark-Verfahrens

(1) Die für die Kurvenanpassung auszuwählenden Modelle sollten den mechanistischen Vorstellungen zur Kanzerogenese nicht widersprechen. Deshalb wird oft das Multistage-Modell herangezogen, das dem Mehrstufenmodell der Krebsentstehung entspricht. Die Gamma-Funktion entspricht jedoch ebenfalls dem mechanistischen Verständnis eines "Multi-Hit"-Modells zur chemischen Kanzerogenese. Multistage- oder Gamma-Funktion sind demnach die bevorzugten Modelle zur Modellierung mit dem Benchmark-Verfahren im experimentellen Bereich. Andere Modelle sollten jedoch nicht ausgeschlossen werden, wenn sie eine deutlich bessere Datenanpassung ermöglichen. Modelle mit einer ähnlichen Anpassungsgüte, die jedoch weniger Parameter für die Modellierung benötigen, sind zu bevorzugen (erkennbar am AIC-Wert in der Ergebnisdarstellung der entsprechenden Software der U.S. EPA). Die Qualität der Datenpassung ist wichtiger im Bereich niedriger experimenteller Konzentrationen als im Bereich hoher Konzentrationen.

Im Abschlussbericht des Projekts FKZ 201 65 201/01 ("Vergleich der Verfahren zur Ableitung gesundheitsbezogener Wirkungsschwellen" Benchmark – NOAEL, Umweltbundesamt 2003) werden die genannten Kriterien diskutiert und begründet.


  1. Abkürzungen beim Benchmarkverfahren: vgl. Glossar


3.5 Umgang mit Hintergrundinzidenz

(1) Entsprechend dem Standardvorgehen beim T25-Ansatz und beim Benchmark-Verfahren (nach Software der U.S. EPA) ist in der Regel der "Extra risk"-Ansatz heranzuziehen.

Die Konvention, das "extra risk" zu wählen, ist aus toxikologischer Sicht nicht gut begründet, wird jedoch als Standardvorgehen akzeptiert, da

  1. in der Regel die Abweichungen bei niedriger Hintergrundrate gering ausfallen,
  2. eine Übereinstimmung mit vielen älteren unit risk-Berechnungen entsteht,
  3. eine Übereinstimmung mit dem T25-Ansatz so gewährleistet ist,
  4. eine Übereinstimmung mit der traditionellen Vorgehensweise beim Multistage-Verfahren so gewährleistet ist.

(2) Bei sehr hohen Inzidenzen in der Kontrollgruppe oder beim Vergleich mit Humandaten ist das "additional risk" heranzuziehen und dieses Vorgehen zu begründen.

3.6 Risikoquantifizierung durch Ausweisung des T25

(1) Die Festlegung eines POD durch die Ausweisung des T25-Wertes nach dem Verfahren von Sanner et al. (2001) und Dybing et al. (1997) erfordert keine Modellierung der Dosis-Wirkungsbeziehung im experimentellen Bereich. T25 wird durch lineare Interpolation bestimmt. Dieses Verfahren ist regelmäßig heranzuziehen, wenn eine qualifizierte Benchmark-Berechnung nicht möglich ist.

Zur näheren Definition des T25 vgl. Glossar

(2) Wenn ausschließlich der Inhalationspfad relevant ist (für Arbeitsplatzgrenzwerte der Fall), wird der T25-Wert als Luftkonzentration (mg/m3 bzw. ppm) ausgedrückt.

Zur weiteren Normierung des T25 auf das Expositionsmuster am Arbeitsplatz siehe Nummer 4.2.

(3) Details zur Vorgehensweise bei diesem T25-Verfahren sind der zitierten Literatur (z. B. EC, 1999, oder auch REACH RIP 3.2-1B preliminary Technical Guidance Document) zu entnehmen. Die wichtigsten Punkte sind:

  • Als Ausgangspunkt wird die niedrigste Dosisgruppe gewählt, die eine signifikant erhöhte Tumorinzidenz aufweist

    Das Kriterium der Signifikanz ist entweder auf statistischer (Fischer Exact Test zum Vergleich der Dosis- mit der Kontrollgruppe) oder auf biologischer Basis festzulegen. Analog FDA (2001) wird die Verwendung eines Signifikanzniveaus von p<0,05 fur seltene Tumore bzw. Tumore mit einer Spontaninzidenz ≤10 % bzw. p<0,01 fur Tumore mit höherer Spontaninzidenz als 10 Prozent vorgesehen. Ggf. sind neben der experimentellen Kontrollgruppe auch die Daten der historischen Kontrolle vergleichend heranzuziehen (vgl. zu historischen Kontrollinzidenzen z. B. Derelanko und Hollinger, 2002)
  • von der Tumorinzidenz in der behandelten Gruppe wird die Spontaninzidenz in der Kontrollgruppe abgezogen

    Eine Korrektur für aufgetretene Mortalität wird im Allgemeinen nicht vorgenommen, so dass bei hoher Mortalität in der betrachteten Dosisgruppe die damit verbundene erhöhte Unsicherheit des T25-Wertes zu diskutieren oder die nächst niedrigere Dosisgruppe zu wählen ist. Hohe Mortalität kann auch bedeuten, dass die Studie nicht mehr für eine Risikoquantifizierung herangezogen werden kann (siehe Nummer 7, Minimalkriterien)
  • T25-Werte werden in der Regel getrennt fur Spezies, Geschlecht und Organ/Tumortyp berechnet (siehe Nummer 3.1 Abs. 6).

    Eine Zusammenfassung von Tumortypen/Organen/Geschlechtern kann mit Begründung erfolgen (siehe Nummer 3.1Abs. 6).
  • Eine gegenüber der Standard-Lebensspanne der Versuchsspezies verkürzte Expositionsdauer und verkürzte Expositionszeit wird korrigiert.

    Die gegenüber der Standard-Lebensspanne (w in Wochen) der Versuchsspezies verkürzte Expositionsdauer (w1 in Wochen) und verkürzte Expositionszeit (w2 in Wochen) wird durch Multiplikation mit dem Faktor (w1 / w)x(w2 / w) korrigiert (siehe Nummer 4.4).
  • Gegenüber den gewählten Standardwerten abweichende Expositionsschemata werden berücksichtigt.

    Dies erfolgt durch lineare Korrekturfaktoren etwa bei Dosierungen/Tag, Expositionstage/Woche, sowie Expositionsdauer/Tag bei Inhalation.
  • Für die Risikoquantifizierung wird der niedrigste, als humanrelevant (in Bezug auf Spezies/Organ/Tumortyp) erachtete T25-Wert verwendet (siehe auch Nummer 3.1).

    Diese Ausführungen sind nicht in voller Übereinstimmung mit der üblichen Vorgehensweise nach EU: Der T25-Wert wurde ursprünglich als körpergewichtsbezogene Stoffdosis konzipiert und somit in mg/kg Körpergewicht/Tag angegeben. Bei Vorliegen mehrerer Studien, die nicht alle Schlundsondierung benutzten, sondern Tiere z.B. über Trinkwasser, Futter oder Atemluft exponierten, wird die Umrechnung der Exposition auf die körpergewichtsbezogene Dosis als gemeinsame Vergleichsbasis vorgeschlagen (EC, 1999). Im vorliegenden Fall ist jedoch die Ausweisung einer Konzentrationsangabe erforderlich (mg/m3).

    Wenn keine Pfad-zu-Pfad-Übertragung zulässig ist (siehe Nummer 4.3), dann kann der entsprechende (orale oder dermale) Ausgangswert für einen inhalativen T25 nicht verwendet werden.

(4) Der T25 wird mit den Faktoren, wie in Nummer 4 spezifiziert, in ein Humanäquivalent umgerechnet (hT25).

3.7 Vorgehen im Falle vorliegender Humandaten

Die Einordnung der Rolle epidemiologischer Beobachtungsstudien im Vergleich zum Tierexperiment bei der Quantifizierung von Krebsrisiken am Arbeitsplatz erfolgte bereits in Nummer 1.1 und bei der Erläuterung der zu Grunde zu legenden Datenbasis ( Nummer 1.5 (1)). Zum hier verwendeten Risikobegriff wird auf Nummer 1.4 verwiesen (Risikozahl).

Die folgenden Hinweise zum Vorgehen setzen eine adäquate epidemiologische Datenlage voraus (für Mindestkriterien siehe Nummer 7.6 dieses Leitfadens).

(1) Bei der Auswahl epidemiologischer Studien ist wie folgt vorzugehen:

  • Die vorhandene Studienevidenz sollte mittels einer strukturierten, systematischen Literatursuche identifiziert und auf ihre Qualität und Eignung für die Risikobewertung geprüft werden. Prinzipien, die für die Auswahl von arbeitsepidemiologischen Studien zur Durchführung einer Meta-Analyse aufgestellt wurden, sollten hier berücksichtigt werden. Es ist im Einzelfall zu entscheiden, ob mehrere Studien für die Bewertung in einer Meta-Analyse zu einem gepoolten Schätzer zusammengefasst werden oder ob einzelne Studien separat bewertet werden, um eine Spannweite von möglichen Risikoszenarien angegeben zu können.

    Literatur: Blair et al., 1995; Roller et al., 2006, Kap. 5.2
  • Generell sind analytische Studiendesigns mit individueller Expositionseinschätzung zur Risikobewertung auszuwählen. Sowohl Kohorten- als auch Fall-Kontroll-Studien können dabei zur Risikobewertung herangezogen werden.

    Die in der Arbeitsepidemiologie verwendeten beobachtenden Studiendesigns lassen sich nach absteigendem Evidenzgrad wie folgt ordnen:
    (1) Kohortenstudie;
    (2) Fall-Kontroll-Studie (FKS);
    (3) Querschnittstudie (QS);
    (4) Ökologische oder Korrelationsstudie (siehe auch Glossar).

    Quantitative Expositionsdaten stehen häufiger in Kohortenstudien zur Verfügung, während Fall-Kontroll-Studien in der Regel eine bessere Berücksichtigung von Störeinflüssen (Confounding) gewährleisten (weitere Details zu den besonderen Stärken und Schwächen der Studiendesigns siehe Ahrens et al., 2008). In begründeten Ausnahmefällen, z. B. im Falle einer in eine Kohorte eingebetteten Fall-Kontroll-Studie mit spezifischeren oder genaueren Informationen zu Exposition und/ oder Endpunkt, kann eine FKS besser für eine Abschätzung von Arbeitsplatzgrenzwerten geeignet sein, als die zu Grunde liegende Kohortenstudie.

(2) Bei der Berücksichtigung von Zielparametern ist wie folgt vorzugehen:

  • Generell sind Maße mit Bezug zur Krebsinzidenz denen der Krebsmortalität vorzuziehen, es sei denn, Inzidenz und Mortalität können aufgrund einer hohen Letalität der Erkrankung (wie z. B. beim Lungenkarzinom) als identisch angesehen werden.
  • Je feiner die betrachteten Endpunkte aufgegliedert werden, umso geringer ist die zahlenmäßige Besetzung der Strata. Es ist also im Einzelfall abzuwägen, ob sich verschiedene Endpunkte sinnvoll kombinieren lassen, um die statistische Power zu erhöhen (d. h. Kombination verschiedener verwandter Tumorentitäten zu einer Gruppe), auch wenn sich kausale Faktoren im Einzelnen unterscheiden können, z. B. bei Leukämien und Lymphomen, Kopf-Hals-Tumoren usw.
  • Es ist im Einzelfall zu entscheiden, ob vorgezogene Endpunkte, wie z. B. biologische Marker, die als notwendige Vorstufe auf der Kausalkette zur untersuchten Zielerkrankung angesehen werden können, als Surrogatparameter in die Bewertung der Studienlage aufgenommen werden können. Ihre Einbeziehung ist sinnvoll, wenn die Demonstration eines frühen klinischen Effektes als Warnsignal anzusehen ist.

    (Warnsignale können die Einführung von Schutzmaßnahmen rechtfertigen.)

(3) Für die Berechnung der Risikozahl kann folgendermaßen vorgegangen werden:

  • Ein Punktschätzer für jede Expositionskategorie (z. B. Median, geometrisches Mittel) ist die bevorzugte Angabe für die Risikoableitung.
  • Ist lediglich eine Expositionsrange berichtet worden (z. B. 1-9 ppm-Jahre), so kann für die Berechnung alternativ die Klassenmitte (hier 5 ppm-Jahre) zu Grunde gelegt werden. Konzentrationsangaben in mg/m3 sollten in stoffspezifische ppm umgerechnet werden. Für diese Berechnung zu Grunde gelegt werden dabei 240 Arbeitstage/Jahr und ein Atemvolumen von z. B. 10 m3 pro Arbeitstag, der mit 8 Stunden veranschlagt wird (das Atemvolumen ist abhängig von der Arbeitsbelastung, 10 m3 betrifft z. B. eine leichte bis moderate Anstrengung)

    (vgl. van Wijngaarden und Hertz-Picciotto (2004) bzw. Kap. 4.5 des Leitfadens).
  • Die kumulierten Konzentrationsangaben in ppm-Jahren sind danach auf den Langzeit-Mittelwert nach 40 Jahren umzurechnen.
  • Je nach Datenlage sind unmittelbar absolute Risikomaße (z. B. kumulatives Risiko) oder – wenn diese nicht berichtet wurden – Maße des Relativen Risikos zur Exposition in Beziehung zu setzen. In der Regel werden Maße wie SMR, SIR, RR oder OR vorliegen. Zur Berechnung des Lebenszeitrisikos der Exponierten können diese relativen Risikoerhöhungen mit einem Schätzwert für das Lebenszeitrisiko der Vergleichsgruppe, z. B. der Allgemeinbevölkerung, multipliziert werden, sofern nicht die ausführliche Sterbetafelmethode verwendet wird.
  • Das für die Expositionsspannweite berichtete Risikomaß (RR/SIR etc.) kann mit dem kumulierten Expositionswert in einer Regressionsanalyse korreliert werden, was eine Extrapolation in den Hoch- bzw. Niedrigrisikobereich und Aussagen zum Risiko pro Unit-Anstieg (1 ppm) der Exposition ermöglicht. Somit kann das Lebenszeitrisiko in Abhängigkeit von einer gegebenen Expositionshöhe bzw. einem angenommenen Arbeitsplatzgrenzwert geschätzt werden.
  • Nach Subtraktion des Risikos der Nicht-Exponierten (z. B. Allgemeinbevölkerung) wird ein Schätzwert des expositionsbezogenen Exzess-Risikos erhalten.
  • Einschränkungen der Aussagekraft der Ergebnisse sind zu diskutieren

    Es wird somit ein Vorgehen analog zu Roller et al. (2006) und Goldbohm et al. (2006) vorgeschlagen.

    Einschränkungen der Aussagekraft der Ergebnisse sind z. B. Bias, mögliches residuelles Confounding, Misklassifikation usw. Die Verwendung von Risikoschätzern, die für Confoundereffekte adjustiert wurden, ist anzustreben. Wegen der Modellabhängigkeit der Adjustierung und zur Abschätzung der Stärke eines möglichen Confounding, sollten Berechnungen adjustierter vs. nicht adjustierter Risiken möglichst einander gegenübergestellt werden.

    Inkonsistente oder nicht vorhandene Dosis-Effektbeziehungen können in epidemiologischen Studien häufig beobachtet werden. Aber auch in den Fällen, in denen Studienergebnisse lediglich das Vorhandensein eines Ursache-Effektzusammenhangs andeuten, können die Daten berücksichtigt werden. Abweichungen von einer erwarteten Dosis-Effektbeziehung und ihre möglichen Ursachen und Konsequenzen für die Risikoextrapolation sind zu diskutieren.

    Es ist zu bedenken, dass der vorgestellte Ansatz Variationen des Risikos zwischen Individuen aufgrund unterschiedlicher Suszeptibilität ignoriert. Die Übertragbarkeit der Ergebnisse auf andere Populationen muss in jedem Einzelfall evaluiert werden. Dabei sind auch mögliche Einschränkungen der Übertragbarkeit, z.B. bei Vorliegen eines Healthy Worker Effekts, zu berücksichtigen. Vor dem Hintergrund einer Bewertung des Risikos von Arbeitsstoffen und der Festlegung von Grenzwerten zur Verbesserung des Arbeitsschutzes sind diese Überlegungen jedoch von untergeordneter Natur.

    Bei semiquantitativen Expositionsangaben und sonst fehlenden epidemiologischen Daten kann versucht werden, ggf. durch Rückfrage bei den Autoren der Originalpublikationen Einstufungskriterien für Expositionsstufen zu ermitteln und dadurch eine quantitative Expositionsbewertung vornehmen zu können.

(4) Abweichungen vom Default sind in folgenden Fällen möglich:

  • Um die Konsistenz der Ergebnisse unter verschiedenen Voraussetzungen prüfen zu können, können von der kumulativen Exposition abweichende Expositionsmodelle (Intensität, Dauer, Expositionsspitzen, Wirkungsschwelle) je nach Wirkprinzip ebenfalls Berücksichtigung finden, falls entsprechende Schätzer in den bewerteten Artikeln dokumentiert wurden.
  • In Ermangelung einer adäquaten Studienlage kann im Ausnahmefall auf die Ergebnisse von Querschnitts- bzw. Korrelationsstudien zurückgegriffen werden. Die Aussagekraft derartiger Studienergebnisse ist mit großem Vorbehalt und unter ausführlicher Darstellung der Limitationen zu diskutieren. Querschnittstudien und ökologische Studien sollten in aller Regel bestenfalls als Ergänzung zu tierexperimentellen Daten herangezogen werden.

(5) Für die Extrapolation in den Niedrigrisikobereich wird auf das Vorgehen bei tierexperimentell-toxikologischen Daten verwiesen (siehe Nummer 5). Humandaten sollten nach Möglichkeit zur Überprüfung der Plausibilität der Extrapolationsfaktoren bei der Übertragung von Tierexperimenten auf den Menschen herangezogen werden.

 

Webcode: M438-60