Entscheidungsstichwort (Thema)
Vertragsarzt. Wirtschaftlichkeitsprüfung. Anwendung der repräsentativen Einzelfallprüfung mit anschließender Hochrechnung. Bindung an Festlegungen in Prüfvereinbarung. Voraussetzung für Rechtmäßigkeit von Honorarkürzungen. Streitwert
Leitsatz (amtlich)
- Eine repräsentative Einzelfallprüfung mit anschließender Hochrechnung darf nur angewandt werden, wenn und soweit auf Grund besonderer Umstände die Regelprüfmethode der statistischen Vergleichsprüfung nach Durchschnittswerten keine beweistauglichen Ergebnisse liefert.
- Die Prüfgremien sind an die Festlegungen in einer Prüfvereinbarung zur Durchführung einer repräsentativen Einzelfallprüfung gebunden, sofern diese nicht gegen die bundesrechtlichen Vorgaben zur effektiven Überwachung der Wirtschaftlichkeit der vertragsärztlichen Leistungen verstoßen.
Normenkette
SGB V § 106 Abs. 3 Sätze 1, 3; SGG § 99 Abs. 3 Nr. 2, § 128
Verfahrensgang
Tenor
Auf die Revision des Klägers werden das Urteil des Landessozialgerichts Baden-Württemberg vom 20. August 2003, das Urteil des Sozialgerichts Karlsruhe vom 11. Dezember 2002 und der Widerspruchsbescheid des Beklagten vom 15. März 2002 aufgehoben. Der Beklagte wird verurteilt, über den Widerspruch des Klägers gegen den Bescheid des Prüfungsausschusses vom 29. Februar 2000 unter Beachtung der Rechtsauffassung des Senats erneut zu entscheiden.
Der Beklagte trägt die Kosten des Verfahrens in allen drei Instanzen. Die Kosten der Beigeladenen werden nicht erstattet.
Tatbestand
I
Streitig ist die Rechtmäßigkeit einer Honorarkürzung wegen unwirtschaftlicher Behandlungsweise.
Der Kläger, als Laborarzt zur vertragsärztlichen Versorgung in E… zugelassen, rechnete im Quartal II/1997 112.610 kurative Behandlungsfälle, 8.617 Mutterschaftsvorsorgefälle und 13 Fälle mit sonstigen Hilfen ab. Dadurch überschritt er den aus 12 Laborarztpraxen im Bereich der Kassenärztlichen Vereinigung (KÄV) Nordbaden ermittelten Fachgruppendurchschnitt um 174 % (kurativ) bzw um 192 % (Mutterschaftsvorsorge). Mit dem Fallwert (kurativ) von 136,28 DM lag er 13,1 % über dem Fachgruppendurchschnitt. Bei einzelnen Leistungen überschritt er den Fachgruppendurchschnitt erheblich.
Auf Grund eines gemeinsamen Prüfantrags der beigeladenen Landesverbände der Krankenkassen und der KÄV unterzog der Prüfungsausschuss die Honorarabrechnung des Klägers, die zuvor sachlich-rechnerisch richtiggestellt worden war, der Wirtschaftlichkeitsprüfung. Als Grundlage diente eine gutachterliche Stellungnahme des ebenfalls im Bereich der KÄV zugelassenen Laborarztes Dr. S…, die dieser nach Überprüfung von 11.281 Fällen, in denen Abrechnungen für die Tage 14. bis 18. April 1997 enthalten waren, angefertigt hatte. Er beschrieb darin 33 Vorgehensweisen, bei denen dem Kläger unwirtschaftliches Handeln vorzuwerfen sei, und schlug zudem die Durchführung von insgesamt 19 sachlich-rechnerischen Richtigstellungen vor. Auf der Grundlage seiner Feststellungen regte Dr. S… an, die Abrechnung des Klägers um insgesamt 19.118.690 Punkte oder – fiktiv auf der Grundlage eines Punktwertes von 10 Pf – um 1.911.869 DM zu kürzen. Dieser Betrag ergab sich durch Hochrechnung der in der Stichprobe von 10,02 % aller kurativen Fälle festgestellten Unwirtschaftlichkeiten bei den einzelnen Leistungen auf 100 %.
Der Prüfungsausschuss übernahm in seinem Bescheid vom 29. Februar 2000 den Vorschlag des Gutachters sowie dessen Begründungen und ergänzte sie hinsichtlich jedes beanstandeten Punktes um Fallbeispiele, die jeweils mit Patientenname und zugehöriger Krankenkasse bezeichnet waren. Außerdem wandelte er in 68 – nicht näher bezeichneten – Fällen die vom Kläger abgerechnete Kombination der Leistungen nach den Nummern 4438, 4716 und 4298 des Einheitlichen Bewertungsmaßstabs für vertragsärztliche Leistungen (EBM-Ä ≪zusammen 2.600 Punkte≫) in Nr 4805 EBM-Ä (250 Punkte) um, wodurch sich die Kürzung um weitere 159.800 Punkte erhöhte. Insgesamt setzte der Prüfungsausschuss eine Honorarkürzung von 1.927.849,00 DM vor Berücksichtigung des Auszahlungspunktwertes fest.
Der Kläger berief sich in seinem Widerspruch gegen diese Entscheidung zunächst darauf, dass Dr. S… als sein unmittelbarer Konkurrent befangen sei, weil ihm die verfügten Kürzungen über eine Erhöhung des Punktwertes der Fachgruppe unmittelbar zugute kämen. Des weiteren bezog er sich auf eine gutachtliche Stellungnahme zu den 33 beanstandeten Punkten, die Prof. Dr. M… vom Institut für Klinische Chemie des Universitätsspitals Zürich auf seinen Auftrag hin angefertigt hatte. Prof. Dr. M… gelangte zu der Bewertung, die ausgesprochenen Kürzungen seien ganz überwiegend nicht gerechtfertigt. Der Beklagte beauftragte daraufhin den im Bereich der KÄV Hessen niedergelassenen Laborarzt Dr. R… mit der Begutachtung der Beschwerdesache. Dr. R… stellte in seinem Gutachten den 33 im Prüfbescheid beanstandeten Punkten jeweils die Stellungnahme des Prof. Dr. M… gegenüber und gab dazu seine eigene Bewertung unter Auflistung sämtlicher betroffener Fälle ab. In einem zusätzlichen 34. Punkt listete er weitere von ihm festgestellte Auffälligkeiten auf. Sein Kürzungsvorschlag belief sich auf insgesamt 19.400.220 Punkte. Das Gutachten des Dr. R… wurde den Prozessbevollmächtigten des Klägers am 12. September 2000 übersandt. Mit Telefax vom 5. Oktober 2000 lehnten diese Dr. R… ebenfalls wegen Besorgnis der Befangenheit ab, weil auch er in beruflicher Konkurrenz zum Kläger stehe.
Im weiteren Verlauf des Widerspruchsverfahrens wurde ein Gutachten des Statistikers Prof. Dr. G… vom 28. September 1999 zur “Genauigkeit einer stichprobenweisen Einzelfallprüfung in Abhängigkeit von der Gesamtzahl der Behandlungsfälle des zu prüfenden Kassenarztes”, das die KÄV im Prüfungsverfahren hinsichtlich des nachfolgenden Quartals III/1997 eingeholt hatte, eingeführt. Prof. Dr. G… gelangte darin zu dem Ergebnis, dass die Prüfung und Hochrechnung einer Stichprobenquote von 0,9 % einer Praxis mit 30.000 Fällen (dh 270 Fälle) je Quartal dieselbe Relation – nicht die absolute Höhe – einer zumutbaren fehlerhaften Kürzung zur Folge habe wie die Hochrechnung des Prüfungsergebnisses einer Stichprobenquote von 20 % (oder 200 Fällen) bei einer Praxis mit 1.000 Behandlungsfällen. Der Kläger erhob Einwendungen gegen die Richtigkeit dieses Gutachtens, indem er eine kritische Würdigung durch Prof. Dr. M… vorlegte.
Der Beklagte wies den Widerspruch des Klägers zurück. In dem 211 Seiten umfassenden Widerspruchsbescheid vom 15. März 2002 ist ausgeführt, der Befangenheitsantrag gegen den Sachverständigen Dr. R… sei durch Beschluss des Beschwerdeausschusses abgelehnt worden, weil er nicht innerhalb von zwei Wochen nach Kenntniserlangung von der Person des Sachverständigen gestellt worden sei und zudem kein Befangenheitsgrund ersichtlich sei. Auch der Beweisantrag des Klägers auf Einholung eines weiteren statistischen Gutachtens von Prof. Dr. C… von der Universität Bonn sei abzulehnen gewesen, weil dieser über keine besseren oder anderen Erkenntnisquellen verfüge als Prof. Dr. G….
Der Beklagte sah unter Berufung auf die Ausführungen von Prof. Dr. G… die Prüfmethode der “stichprobenweisen Einzelfallprüfung” als sachgerecht und praktikabel an. Danach genüge bei der Praxis des Klägers eine Stichprobenquote von 10 % für eine ausreichend genaue Hochrechnung. Für die Stichprobe seien die fünf Abrechnungstage 14. bis 18. April 1997 zufällig ausgewählt worden, welche ca 10 % der Fälle der Praxis umfassten. Diese Auswahl sei nicht nur praktikabel, sondern auch zweckmäßig, weil hierdurch eine Momentaufnahme der gesamten Laborpraxis entstehe; dass sich “Ausreißertage” darunter befänden, sei nicht ersichtlich. Ein statistischer Vergleich mit der Fachgruppe der Laborärzte sei nicht sachgerecht, da bei kleineren Fachgruppen – hier 12 Laborärzte im Bereich der KÄV Nordbaden – die stichprobenweise Einzelfallprüfung mit Hochrechnung nach Auffassung des Sachverständigen Prof. Dr. G… zu genaueren Ergebnissen führen könne als der Vergleich des zu prüfenden Arztes mit wenigen Ärzten seines Fachgebiets. Er – der Beklagte – sei auch berechtigt, andere als in der Prüfvereinbarung verankerte Prüfmethoden anzuwenden, wenn in besonders gelagerten Fällen keine der bisher in der Praxis entwickelten und durch die Rechtsprechung bestätigten Prüfmethoden geeignet seien.
In der Sache schloss sich der Beklagte jeweils den Darlegungen seines Sachverständigen Dr. R… vollinhaltlich an und stellte die daraus resultierenden Streichungen bzw Umsetzungen in einer Liste zusammen. Den insgesamt für zutreffend erachteten Kürzungsbetrag ermittelte er, indem zunächst für jede einzelne Abrechnungsnummer deren für unwirtschaftlich erachtete Gesamtzahl innerhalb aller Beanstandungen festgestellt wurde. Dies ergab einen Katalog von 94 beanstandeten Abrechnungsnummern. Bei 28 Gebührenordnungsnummern in der geprüften Stichprobe von 11.281 Fällen wurde die Streichung einer einzigen Leistung verfügt. Wie bei allen anderen Nummern auch wurden sodann die zu streichenden Leistungen auf 100 % der Fälle hochgerechnet. Dem so ermittelten Wert an zu streichenden Leistungen wurde die Ansatzhäufigkeit der betreffenden Leistung in der Anzahlstatistik nach sachlich-rechnerischer Richtigstellung gegenübergestellt. Sofern die Häufigkeit der Leistungsnummer in der Anzahlstatistik geringer war als die Zahl der nach Hochrechnung zu streichenden Leistungen, wurde diese geringere Zahl gestrichen, dh die Leistungsnummer blieb unvergütet. Die Gesamtzahl der auf diese Weise zu kürzenden Leistungen belief sich auf 20.714.880 Punkte. Hiervon wurden – ebenfalls nach Hochrechnung – 202.250 Punkte im Hinblick auf erfolgte Umsetzungen zugunsten des Klägers abgezogen, sodass sich ein Kürzungsvolumen von 20.512.630 Punkten ergab. Von diesem bereinigten Kürzungsvolumen zog der Beklagte sodann einen Sicherheitsabschlag in Höhe von 5 % ab, sodass die verbleibende Kürzung 19.486.998,5 Punkte umfasste. Der Beklagte berief sich bei der Bemessung dieses Sicherheitsabschlags auf seinen Ermessensspielraum und darauf, dass bereits bei einer Stichprobenquote von nur 0,9 % der Gesamtfallzahl eine Konfidenzwahrscheinlichkeit von mindestens 95 % gegeben sei, durch die erfolgte Prüfung von 10 % der Fälle aber ein wesentlich zuverlässigeres Ergebnis erzielt werde. Unter Beachtung des Verböserungsverbots sei die etwas geringere Kürzung der Honoraranforderung durch den Prüfungsausschuss zu bestätigen gewesen.
Die Klage gegen den Widerspruchsbescheid ist ebenso wie die Berufung ohne Erfolg geblieben. Das Landessozialgericht (LSG) hat keine hinreichenden Gründe dafür gesehen, dass der Kläger unter Zugrundelegung der Ansicht eines objektiv und vernünftig denkenden Beteiligten Misstrauen gegen die Unparteilichkeit des Sachverständigen Dr. R… haben könne. Der Bescheid des Beklagten sei auch in materieller Hinsicht rechtmäßig. Er habe zu Recht angenommen, dass die Regelprüfmethode des statistischen Kostenvergleichs wegen der geringen Größe der Vergleichsgruppe nicht habe herangezogen werden können. Deshalb habe er sich der Methode einer stichprobenweisen Einzelfallprüfung mit Hochrechnung bedienen dürfen. Angesichts der hohen Zahl an Behandlungsfällen reiche es aus, wenn nur ungefähr 10 % aller Fälle einer Einzelfallprüfung unterzogen worden seien. Die von den Prüfgremien in nebenamtlicher Tätigkeit wahrgenommene Wirtschaftlichkeitsprüfung müsse praktikabel bleiben. Zudem sei die Behandlungsweise des Klägers durch sich wiederholende Untersuchungsabläufe geprägt, bei denen er aus medizinisch-wissenschaftlichen Gründen immer dieselben Leistungen für erforderlich halte. Aus diesem Grunde könne bereits anhand weniger Einzelfälle davon ausgegangen werden, dass in allen Fällen, in denen die jeweiligen Untersuchungen erfolgten, dieselben Leistungen in gleichem Umfang berechnet worden seien. Bei dieser Sachlage sei es nicht erforderlich gewesen, ein weiteres Sachverständigengutachten zur Genauigkeit der stichprobenweisen Einzelfallprüfung in Abhängigkeit von der Gesamtzahl der Behandlungsfälle einzuholen. Nicht zu beanstanden sei auch die zufällige Auswahl der geprüften Behandlungsfälle der Abrechnungstage vom 14. bis 18. April 1997. Die Behandlungsweise des Klägers sei in dem in den Punkten 1 bis 34 des Widerspruchsbescheids beschriebenen Umfang unwirtschaftlich. Die Stellungnahmen des Dr. R…, auf die sich der Beklagte gestützt habe, seien nachvollziehbar. Deshalb bestehe kein Anlass, ein Sachverständigengutachten zur Notwendigkeit der vom Kläger erbrachten Leistungen einzuholen. Auch die Höhe der festgesetzten Honorarkürzung sei rechtsfehlerfrei ermittelt worden. Der Beklagte sei nicht verpflichtet gewesen, einen höheren Sicherheitsabschlag als 5 % des errechneten Kürzungsbetrags einzuräumen, da er zu Recht von einer hohen Konfidenzwahrscheinlichkeit ausgegangen sei. Schließlich habe der Beklagte nicht mehr Leistungen gestrichen, als der Kläger überhaupt berechnet habe.
Mit seiner Revision rügt der Kläger eine Abweichung von den Anforderungen, die das Bundessozialgericht (BSG) für die Prüfmethode der Einzelfallprüfung mit Hochrechnung im Urteil vom 8. April 1992 (BSGE 70, 246, 254 f = SozR 3-2500 § 106 Nr 10 S 52 f) aufgestellt habe und die im Urteil vom 14. Juli 1993 (6 RKa 13/91 – USK 93115) bekräftigt worden seien. Insbesondere habe der Sicherheitsabschlag nicht auf 5 % reduziert werden dürfen. Darüber hinaus sei die Durchführung der Einzelfallprüfung fehlerhaft, weil zu keiner Zeit offen gelegt wurde, nach welcher Methode oder nach welchen abstrakten Kriterien die Stichprobe ausgewählt worden sei; dies verletze das rechtliche Gehör. Das LSG habe außerdem gegen seine Verpflichtung zur Amtsermittlung verstoßen, indem es kein weiteres statistisches Gutachten herangezogen und auch kein zusätzliches medizinisch-technisches Gutachten über die Richtigkeit seiner – des Klägers – Leistungsabrechnung eingeholt habe. Das vom Beklagten und vom LSG zur Stützung seiner Ansicht verwertete Gutachten des Dr. R… beruhe wesentlich auf dem Vorgutachten des als befangen ausgeschlossenen Dr. S… und sei daher nicht verwertbar. Die Entscheidung des LSG verletze zudem § 106 Fünftes Buch Sozialgesetzbuch (SGB V), indem sie die rechtswidrige Wahl der Prüfungsmethode durch den Beklagten gebilligt habe. Eine eingeschränkte Einzelfallprüfung komme nach der Rechtsprechung des BSG nur in Betracht, wenn aussagekräftigere Beweismethoden nicht zur Verfügung stünden. Dies sei hier jedoch der Fall, denn die Größe der Vergleichsgruppe von 12 Laborärzten schließe die statistische Vergleichsprüfung nicht aus. Da dem Beklagten bei der Auswahl der Prüfungsmethode und der Beurteilung der Geeignetheit der statistischen Vergleichsprüfung entgegen der Auffassung des LSG kein Beurteilungsspielraum zukomme, habe die Einzelfallprüfung mit Hochrechnung nicht durchgeführt werden dürfen. Weiterhin habe keine Reduzierung der Anforderungen an die Einzelfallprüfung mit Hochrechnung erfolgen dürfen. Bei den geprüften Laborleistungen müsse berücksichtigt werden, dass derzeit ca 3.500 verschiedene Untersuchungsleistungen abgerechnet werden könnten, von denen jede einzelne ihre spezifischen Besonderheiten aufweise. Bei einer derartigen Vielfalt an Leistungen könne eine repräsentative Stichprobe nur erreicht werden, wenn auch der Umfang der Stichprobe entsprechend groß gewählt werde. Die Halbierung der Stichprobe durch den Beklagten habe dazu geführt, dass bei zahlreichen Untersuchungsarten nur ein einziger Behandlungsfall mit der entsprechenden Leistung in der Stichprobe enthalten gewesen sei; Beanstandungen bei diesen geringen Fallzahlen rechtfertigten indes nicht den Schluss, der Kläger habe in den nicht überprüften gleichartigen Behandlungsfällen in gleicher Weise unwirtschaftlich gehandelt.
Das LSG habe des weiteren die Grenzen des dem Beklagten zukommenden Beurteilungsspielraums verkannt, indem es die im Widerspruchsbescheid behaupteten Unwirtschaftlichkeiten trotz seiner – des Klägers – detaillierten Einwendungen insgesamt und ohne nachvollziehende Prüfung unter Hinweis auf die Besetzung des Beklagten mit sachkundigen Vertretern akzeptiert habe. Schließlich habe der Beklagte ausweislich seines Bescheids im Rahmen der Wirtschaftlichkeitsprüfung sachlich-rechnerische Richtigstellungen durchgeführt und deren Ergebnisse von der Stichprobe auf 100 % hochgerechnet. Das sei nach der gefestigten Rechtsprechung des BSG unzulässig. Zudem habe er unstatthafte Doppelkürzungen vorgenommen, indem er die Absetzungen auf Grund der Höchstwertregelungen des EBM-Ä bei zahlreichen im Einzelnen angegebenen Leistungsnummern nicht hinreichend berücksichtigt habe. Diese stünden den Praxisbudgets in der Wirkung gleich. Für letztere habe das BSG bereits entschieden, dass Honorarkürzungen bei budgetierten Leistungen grundsätzlich nur mit dem Wert erfolgen dürften, den diese Leistungen im Budget tatsächlich hätten. Diese Doppelkürzung habe beispielsweise bei der Leistung nach Nr 4417 EBM-Ä dazu geführt, dass er – der Kläger – auf Grund der Kombination der Kürzungen letztlich keine einzige dieser Leistungen vergütet erhalten habe.
Der Kläger beantragt,
das Urteil des Landessozialgerichts Baden-Württemberg vom 20. August 2003, das Urteil des Sozialgerichts Karlsruhe vom 11. Dezember 2002 und den Bescheid des Beklagten vom 15. März 2002 aufzuheben und den Beklagten zu verpflichten, erneut über den Widerspruch gegen den Bescheid des Prüfungsausschusses vom 29. Februar 2000 unter Beachtung der Rechtsauffassung des Gerichts zu entscheiden;
hilfsweise, das Urteil des Landessozialgerichts Baden-Württemberg vom 20. August 2003 aufzuheben und die Sache zur erneuten Verhandlung und Entscheidung an das Landessozialgericht zurückzuverweisen.
Der Beklagte beantragt,
die Revision zurückzuweisen.
Er hält das Urteil des LSG für zutreffend. Der Kläger habe nicht substantiiert dargelegt, weshalb der Sachverständige Dr. R… befangen gewesen sein soll. Eine statistische Vergleichsprüfung sei im Hinblick auf die Inhomogenität der nur aus 12 Laborarztpraxen bestehenden Vergleichsgruppe ausgeschlossen. Zudem habe eine Auswertung der Anzahlstatistiken des Klägers ergeben, dass 37 % der von ihm abgerechneten Gebührenordnungsnummern nur von 50 % oder weniger Ärzten der Fachgruppe erbracht würden. Die Besonderheiten des Falles hätten es erfordert, bei der deshalb durchgeführten Einzelfallprüfung mit Hochrechnung eine geringere Zahl von Behandlungsfällen als die bislang geforderten 20 % aller Fälle zu prüfen. Entgegen dem Vortrag des Klägers habe er – der Beklagte – keine sachlich-rechnerische Richtigstellung vorgenommen, obwohl er hierzu im Rahmen einer Annexkompetenz ohne weiteres befugt sei. Auch die Höchstwertregelungen des EBM-Ä seien beachtet worden; die verfügten Kürzungen hätten nicht dazu geführt, dass für einzelne Leistungen eine Vergütung vollständig entfallen sei. Im Hinblick auf die standardisierten Abrechnungsvorgänge sei es nicht erforderlich gewesen, einen höheren Sicherheitsabschlag als 5 % zu gewähren.
Die zu 1. beigeladene KÄV Baden-Württemberg, die zum 1. Januar 2005 die Rechtsnachfolge der ursprünglich beigeladenen KÄV Nordbaden angetreten hat, stellt keinen Antrag und schließt sich im Übrigen den Ausführungen des Beklagten an. Die weiteren Beigeladenen äußern sich im Revisionsverfahren nicht.
Entscheidungsgründe
II
Die Revision des Klägers ist begründet. Die Vorinstanzen haben die Klage gegen den Bescheid des Beklagten zu Unrecht abgewiesen. Dieser ist rechtswidrig und beschwert den Kläger im Sinne von § 54 Abs 1 Satz 2 Sozialgerichtsgesetz (SGG). Der Beklagte war nicht berechtigt, von der Regelprüfmethode einer statistischen Vergleichsprüfung abzuweichen. Außerdem hat er bei Durchführung der Einzelfallprüfung mit anschließender Hochrechnung ohne rechtfertigenden Grund gegen die ihn bindenden Festlegungen zu dieser Methode in der Prüfvereinbarung verstoßen. Bereits aus diesen Gründen muss der Bescheid aufgehoben und der Beklagte verpflichtet werden, unter Beachtung der Rechtsauffassung des Senats erneut über den Widerspruch des Klägers gegen den Bescheid des Prüfungsausschusses zu entscheiden. Die darüber hinaus von der Revision geltend gemachten Verfahrensmängel sind deshalb ohne Bedeutung.
Rechtsgrundlage für Honorarkürzungen wegen unwirtschaftlicher Behandlungsweise ist § 106 Abs 2 Satz 1 SGB V in der hier noch maßgeblichen Fassung des Gesundheitsstrukturgesetzes (GSG – vom 21. Dezember 1992, BGBl I 2266). Danach wird die Wirtschaftlichkeit der Versorgung durch arztbezogene Prüfungen ärztlicher und ärztlich verordneter Leistungen nach Durchschnittswerten beurteilt. Nach den hierzu von der Rechtsprechung entwickelten Grundsätzen ist die statistische Vergleichsprüfung die Regelprüfmethode (stRspr, s BSG SozR 4-2500 § 106 Nr 4 RdNr 5, mwN). Die Abrechnungswerte des Arztes werden mit denjenigen der Fachgruppe oder mit denen einer nach verfeinerten Kriterien gebildeten engeren Vergleichsgruppe im selben Quartal verglichen. Ergänzt durch die sog intellektuelle Betrachtung, bei der medizinisch-ärztliche Gesichtspunkte berücksichtigt werden, ist dies die Methode, die typischerweise die umfassendsten Erkenntnisse bringt. Ergibt die Prüfung, dass der Behandlungsaufwand des Arztes je Fall bei dem Gesamtfallwert, bei Sparten- oder Einzelleistungswerten in offensichtlichem Missverhältnis zu dem durchschnittlichen Aufwand der Vergleichsgruppe steht, ihn nämlich in einem Ausmaß überschreitet, das sich im Regelfall nicht mehr durch Unterschiede in der Praxisstruktur oder in den Behandlungsnotwendigkeiten erklären lässt, hat das die Wirkung eines Anscheinsbeweises der Unwirtschaftlichkeit (stRspr, zB BSG SozR 4-2500 § 106 Nr 3 RdNr 8, mwN).
Die Prüfgremien sind jedoch berechtigt und verpflichtet, ausnahmsweise auch andere Prüfmethoden anzuwenden oder neu zu entwickeln, wenn sich im Einzelfall die Prüfung nach Durchschnittswerten als nicht aussagekräftig oder nicht durchführbar erweist (BSGE 75, 220, 224 = SozR 3-2500 § 106 Nr 24 S 135; BSGE 84, 85, 86 f = SozR 3-2500 § 106 Nr 47 S 250 f; SozR aaO Nr 55 S 310 f). Im Interesse einer gleichmäßigen Rechtsanwendung hat der Senat allerdings betont, dass plausible Gründe vorliegen müssen, um von einer Vergleichsprüfung nach Durchschnittswerten abzusehen (BSGE 77, 53, 58 = SozR 3-2500 § 106 Nr 33 S 189). So ist als Voraussetzung für die Anwendung eines sog Vertikalvergleichs verlangt worden, dass einem Horizontalvergleich nach Durchschnittswerten die Grundlage entzogen ist, weil entweder der zu prüfende Arzt eine unvergleichbare individuelle Praxisausrichtung hat oder weil dessen Grundannahme, die Vergleichsgruppe handele im Durchschnitt insgesamt wirtschaftlich, nicht zutrifft (BSGE 84, 85, 86 = SozR 3-2500 § 106 Nr 47 S 250; SozR aaO Nr 55 S 308). Der Senat hat zudem klargestellt, dass generelle Bedenken der Prüfgremien gegen die Geeignetheit der Regelprüfmethode einer statistischen Vergleichsprüfung nach Durchschnittswerten keine Rechtfertigung dafür sein können, zu der Methode einer repräsentativen Einzelfallprüfung mit anschließender Hochrechnung überzugehen. Deshalb ist die Begründung, eine repräsentative Einzelfallprüfung führe zu einem genaueren und gerechteren Ergebnis als die Prüfung nach Durchschnittswerten, als Überschreitung der Grenzen des Beurteilungsspielraums zurückgewiesen worden (BSGE 77, 53, 56 = SozR 3-2500 § 106 Nr 33 S 187).
Darüber hinaus geht der Senat in ständiger Rechtsprechung davon aus, dass die Vergleichsprüfung nach Durchschnittswerten nicht nur hinsichtlich des Gesamtfallwertes, sondern unter der Voraussetzung einer hinreichenden Vergleichbarkeit ebenso auch zur Überprüfung der Wirtschaftlichkeit des Ansatzes einer einzelnen Leistungsposition bzw mehrerer zu Leistungssparten zusammengefasster Leistungspositionen des EBM-Ä herangezogen werden kann (BSG SozR 4-2500 § 106 Nr 3 RdNr 9 mwN; zur Bestimmung der Grenze zum offensichtlichen Missverhältnis bei Einzelleistungsprüfungen s auch Urteil vom heutigen Tage, B 6 KA 79/03 R – juris). Die Prüfung nach Durchschnittswerten setzt allerdings voraus, dass die Vergleichsgruppe ausreichend groß und hinreichend homogen zusammengesetzt ist, um statistisch aussagekräftige Ergebnisse zu erhalten (BSG SozR 3-2500 § 106 Nr 36 S 204; BSG SozR 4-2500 § 106 Nr 2 RdNr 11 ff). Die Kriterien der Homogenität und der Größe einer Vergleichsgruppe stehen dabei in einer Wechselbeziehung zueinander in dem Sinne, dass eine Gruppe um so größer sein muss, je weniger homogen sie ist, während für sehr homogene Gruppen auch kleine Zahlen ausreichend sein können (Clemens in Schulin, Handbuch des Sozialversicherungsrechts, Band 1, Krankenversicherungsrecht, 1994, § 35 RdNr 58; Engelhard in Hauck/Noftz, SGB V, Stand Dezember 2004, K § 106 RdNr 333 f). In diesem Sinne hat der Senat für den statistischen Vergleich von Röntgenleistungen bei Internisten eine Gruppengröße von neun Ärzten mit derselben Röntgengenehmigung für ausreichend erachtet (BSG, Urteil vom 27. April 1982 – 6 RKa 7/79 = USK 82196). Bei Pathologen hat die Instanzrechtsprechung im Hinblick auf deren hohe Fallzahlen bereits eine aus sieben bis neun Praxen bestehende Vergleichsgruppe genügen lassen (vgl Engelhard in Hauck/Noftz, aaO RdNr 334).
Das Festhalten an der Prüfung nach Durchschnittswerten als Regelprüfmethode beruht auch darauf, dass diese Prüfart in ihrem Anwendungsbereich in praktikabler Weise und mit vertretbarem Aufwand zu tragfähigen Erkenntnissen führt. Auch wenn mit dieser Beweismethode nicht alle Unwirtschaftlichkeiten in vollem Umfang aufgedeckt werden können, genügt sie doch am besten den Erfordernissen einer effizienten und gleichmäßigen Wirtschaftlichkeitsprüfung der Quartal für Quartal in sehr großer Zahl anfallenden vertragsärztlichen Leistungen. Dem gegenüber kann der mit einer eingeschränkten Einzelfallprüfung verbundene Aufwand zur Verifizierung von Unwirtschaftlichkeiten unter Berücksichtigung aller dem Arzt in jedem Einzelfall zur Verfügung stehenden Einwendungen um ein Vielfaches höher sein und letztlich – wie der vorliegende Fall zeigt – dazu führen, dass die Prüfung nicht mehr in angemessener Zeit und mit noch beherrschbarem Aufwand in rechtsstaatlich einwandfreier Weise abgewickelt werden kann. Die weiteren Prüfmethoden können daher immer nur dann herangezogen werden, wenn und soweit auf Grund besonderer Umstände die Regelprüfmethode keine beweistauglichen Ergebnisse liefert.
Auf dieser Grundlage können die Gründe, die der Beklagte im Widerspruchsbescheid benannt hat, im vorliegenden Fall ein Absehen von der Anwendung der Regelprüfmethode der statistischen Vergleichsprüfung nicht rechtfertigen. Der Beklagte hat ausgeführt, bei kleinen Fachgruppen könne die stichprobenweise Einzelfallprüfung mit Hochrechnung der Kürzungen zu genaueren Ergebnissen führen als der Vergleich des zu prüfenden Vertragsarztes mit den wenigen Ärzten seines Fachgebiets. Unabhängig davon, dass bei Laborärzten Praxisbesonderheiten in diesem Sinne nicht gesehen werden könnten, würden diese auch nur dann zum Tragen kommen, wenn ein Vergleich mit der Fachgruppe erfolge. Diese Begründung lässt nicht erkennen, dass der Beklagte das Leistungsverhalten in der Fachgruppe anhand der Abrechnungsstatistiken näher analysiert und auf dieser Grundlage eine Bewertung vorgenommen hat, ob die Gruppe bei den für die Prüfung wesentlichen Leistungen für einen statistischen Vergleich hinreichend groß und – in wechselseitiger Abhängigkeit – ausreichend homogen ist.
Von den 12 Laborärzten im Bereich der KÄV erbrachten nach den Angaben der Beigeladenen zu 1. im Revisionsverfahren immerhin acht Praxen Leistungen in einem Umfang, dass von hauptberuflich in Vollzeit betriebenen Laboren ausgegangen werden kann. Dies stellt bei entsprechender Homogenität eine für die Prüfung nach Durchschnittswerten ausreichend große Vergleichsgruppe dar. Darüber hinaus ist eine fehlende Homogenität insbesondere bei den wenigen Leistungen, die den überwiegenden Teil der vom Beklagten für unwirtschaftlich erachteten und deshalb gekürzten Leistungen ausmachen, nicht ohne weiteres ersichtlich. Beispielsweise wurde die Leistung nach Nr 4298 EBM-Ä, auf die fast ein Drittel des gesamten Kürzungsvolumens entfällt, von neun der 12 Laborarztpraxen abgerechnet. Die Leistung nach Nr 4515 EBM-Ä, auf die weitere 20 % der Kürzungssumme entfallen, brachten 11 Laborärzte in Ansatz. Die Leistung mit dem dritthöchsten Kürzungsbetrag, Nr 4625 EBM-Ä, rechneten 10 der 12 Laborarztpraxen ab, und zwar im Durchschnitt in genau derselben Häufigkeit wie der Kläger. Der Hinweis des Beklagten darauf, dass bei Laborärzten Praxisbesonderheiten nicht gesehen werden könnten, weist vielmehr darauf hin, dass er insgesamt von einer relativ homogenen Leistungsstruktur in dieser Fachgruppe ausging. Der Beklagte hat die Vergleichsgruppe von 12 Laborärzten auch nicht als generell ungeeignet zur Durchführung einer statistischen Prüfung beurteilt, sondern die Abweichung von der Regelprüfmethode lediglich damit gerechtfertigt, dass die stichprobenweise Einzelfallprüfung mit Hochrechnung “zu genaueren Ergebnissen führen könne”. Diese auch in dem Gutachten von Prof. Dr. G… nicht näher belegte Möglichkeit rechtfertigt es jedoch nicht, bei kleinen Vergleichsgruppen generell und ohne Untersuchung ihrer Homogenität von der in § 106 Abs 2 Nr 1 SGB V als Regelprüfmethode ausgestalteten Durchschnittsprüfung abzusehen und auf die mit erheblichen Nachteilen behaftete eingeschränkte Einzelfallprüfung mit Hochrechnung auszuweichen. Nur wenn die fehlende Homogenität oder eine zu geringe Größe der Vergleichsgruppe belegt und auch keine Abhilfe durch eine Vergrößerung der Vergleichsbasis – etwa im Wege der Einbeziehung der Abrechnungswerte von weiteren Ärzten derselben Fachgruppe aus anderen KÄVen (vgl BSG, Urteil vom 19. November 1985, 6 RKa 13/84 = USK 85215; Urteil vom 1. Oktober 1990, 6 RKa 32/89 = USK 90102) – möglich ist, kann auf eine der nachrangigen Prüfmethoden zurückgegriffen werden. Die Darlegungen des Beklagten im Widerspruchsbescheid lassen eine Prüfung dieser Voraussetzungen nicht sichtbar werden; sie zielen vielmehr darauf, bei kleinen Vergleichsgruppen in unstatthafter Weise stets der Einzelfallprüfung den Vorzug gegenüber einer Prüfung nach Durchschnittswerten zu geben.
Auch die Erwägungen im Urteil des SG können nicht plausibel machen, dass die Fachgruppe der Laborärzte im Bezirk Nordbaden “ausgesprochen inhomogen” ist. Die Inhomogenität der erbrachten ärztlichen Leistungen kann nicht dadurch belegt werden, dass nur sieben von 12 Praxen (dh 58 %) und nur hinsichtlich ihrer Fallzahlen und Gesamtfallwerte betrachtet werden. Es mag sein, dass bei näherer Untersuchung einzelner selten oder nur schwerpunktmäßig von wenigen Praxen erbrachter Leistungsnummern der zahlreichen Leistungen aus Abschnitt O des EBM-Ä eine hinreichende Homogenität nicht mehr angenommen werden kann. Das rechtfertigt es dann aber nur, in Bezug auf diese betroffenen Einzelleistungen eine nachrangige Prüfmethode zur Anwendung zu bringen. Bei allen anderen Leistungsnummern, die keine Anzeichen für Inhomogenität aufweisen, muss es bei der Regelprüfmethode des Vergleichs nach Durchschnittswerten verbleiben. Denn soweit aussagekräftige statistische Vergleichszahlen vorliegen, dürfen diese bei der Prüfentscheidung nicht unberücksichtigt bleiben (BSGE 77, 53, 60 = SozR 3-2500 § 106 Nr 33 S 191).
Abgesehen von der nicht ausreichend begründeten Wahl der nachrangigen Prüfmethode einer repräsentativen Einzelfallprüfung mit anschließender Hochrechnung kann der Bescheid des Beklagten auch noch aus einem anderen Grund keinen Bestand haben. Denn selbst wenn hinsichtlich einzelner Leistungen diese Prüfmethode in zulässiger Weise herangezogen werden kann, war der Beklagte doch nicht berechtigt, ohne zwingende Gründe von den in der Prüfvereinbarung normativ vorgegebenen Regeln für die Durchführung einer repräsentativen Einzelfallprüfung mit anschließender Hochrechnung abzuweichen. Nach den Feststellungen des Berufungsgerichts ist in § 16 Abs 4 der für das Prüfungsquartal geltenden Prüfvereinbarung vorgesehen, dass bei der Prüfung einer repräsentativen Anzahl von Beispielsfällen mindestens 20 % der Fälle zu untersuchen und im Rahmen der Hochrechnung der festgestellten Unwirtschaftlichkeit auf die Gesamtheit aller Fälle ein Sicherheitsabschlag von 25 % vorzunehmen ist. Diese Regelung entspricht ersichtlich den Vorgaben, die das BSG als regelmäßige Voraussetzung für die Zuverlässigkeit dieser Beweismethode aufgestellt hat (BSGE 70, 246, 255 = SozR 3-2500 § 106 Nr 10 S 52 f). Entgegen der Auffassung der Vorinstanzen ist der Beklagte bei Durchführung der Wirtschaftlichkeitsprüfung grundsätzlich an die Bestimmungen der Prüfvereinbarung gebunden. Bei der auf der Grundlage von § 106 Abs 3 Satz 1 und 3 SGB V abgeschlossenen Prüfvereinbarung handelt es sich um einen Normvertrag auf der Ebene des Gesamtvertrags. Zu den wesentlichen Merkmalen eines solchen Normvertrages gehört es, dass seine Regelungen für die von ihm betroffenen Beteiligten verbindlich sind. Nur soweit die Vorschriften in der Prüfvereinbarung gegen höherrangiges Recht verstoßen, insbesondere mit den bundesrechtlichen Vorgaben zur effektiven Überwachung der Wirtschaftlichkeit der ärztlichen Leistungserbringer nicht vereinbar sind, sind sie nach den allgemeinen Regeln der Normenhierarchie nichtig und damit auch für den Beklagten nicht maßgeblich (BSGE 77, 53, 60 = SozR 3-2500 § 106 Nr 33 S 191; Nr 51 S 278; Nr 53 S 289 f).
Ein solcher Fall liegt hier indessen nicht vor. Es ist nicht ersichtlich, dass bei Beachtung der Regelungen in § 16 Abs 4 der Prüfvereinbarung eine wirksame Überwachung der Wirtschaftlichkeit der Vertragsärzte im Anwendungsbereich der Prüfmethode der repräsentativen Einzelfallprüfung mit anschließender Hochrechnung verhindert wird. Wie der vorliegende Fall zeigt, trägt vielmehr gerade die Heranziehung dieser nachrangigen Prüfmethode ohne zwingenden Grund zu einem Verlust an Effizienz der Wirtschaftlichkeitsprüfung bei. Wird hingegen der Vorrang der Prüfung nach Durchschnittswerten auch hinsichtlich der Einzelleistungen beachtet, ist das Problem des Prüfaufwands bei der in der Prüfvereinbarung vorgeschriebenen Begutachtung von mindestens 20 % der Behandlungsfälle bei übergroßen Fallzahlen wesentlich entschärft.
Auch hinsichtlich des vorgesehenen Sicherheitsabschlags von 25 % im Rahmen der Hochrechnung der festgestellten Unwirtschaftlichkeit sind zwingende Gründe für eine Reduzierung nicht erkennbar. Der Sicherheitsabschlag berücksichtigt den Umstand, dass selbst bei einer Konfidenzwahrscheinlichkeit von 95 % oder höher ein Restrisiko verbleibt, dass der hochgerechnete Kürzungsbetrag unrichtig und damit zu hoch ist. Die absolute Höhe der – potentiellen – Unrichtigkeit des Kürzungsvolumens (sog “Konfidenzbereich” der hochgerechneten Kürzung) nimmt mit zunehmender Gesamtfallzahl der geprüften Grundgesamtheit sogar zu. Da jede einzelne Honorarkürzungsmaßnahme mit an Sicherheit grenzender Wahrscheinlichkeit rechtmäßig sein muss, ist über einen ausreichend bemessenen Sicherheitsabschlag zu gewährleisten, dass die hochgerechnete Kürzung in jedem Einzelfall nicht zu hoch ausfällt. Dem trägt der Abschlag von 25 % Rechnung. Es genügt aus Rechtsgründen nicht, dass sich – wie geltend gemacht – Kürzungen über den Verlauf längerer Zeiträume nach derselben Methode als “statistisch gerecht” ausgleichen mögen. Die Rechtmäßigkeit von Honorarkürzungen setzt voraus, dass sie sich in dem zu Grunde liegenden Prüfzeitraum mit an Gewissheit grenzender Wahrscheinlichkeit als rechtmäßig erweisen (§ 128 SGG). Denn ob es überhaupt über einen längeren Zeitraum zu nachfolgenden Prüfungen und Kürzungsmaßnahmen kommt, steht nicht fest, zumal die Wirtschaftlichkeitsprüfung gerade auf eine Verhaltensänderung der Ärzte, bei denen unwirtschaftliches Handeln festgestellt worden ist, abzielt.
Im Übrigen ist die Vorgehensweise des Beklagten im Einzelnen in sich widersprüchlich und führt zu nicht zu rechtfertigenden Ergebnissen. So ist bei der Überprüfung der Stichprobe von 11.181 Behandlungsfällen (mit über 15.000 Behandlungsscheinen) der Ansatz von drei Leistungen nach Nr 4378 EBM-Ä als unwirtschaftlich erkannt worden. Diese drei Leistungen wurden auf 30 als unwirtschaftlich erbrachte Leistungen hochgerechnet, wobei der Kläger diese Leistung insgesamt nur elfmal abgerechnet hatte. Dieser elfmalige Ansatz der Leistungen ist gestrichen worden, obwohl der zweifelhafte Ansatz von drei Leistungen bei 11.181 Behandlungsfällen keine Rückschlüsse auf eine unwirtschaftliche Behandlungsweise zulässt.
Des Weiteren wurden die auf der Grundlage der Einzelfallprüfung mit anschließender Hochrechnung als unwirtschaftlich erkannten Leistungen in vollem Umfang gestrichen. Dabei wurde nicht berücksichtigt, dass ein erheblicher Teil der Leistungen bereits nach Anwendung des Regelwerkes nicht vergütet worden war und damit nur die verbleibenden Ansätze dieser Leistungen in Höhe des als unwirtschaftlich erkannten Prozentsatzes der hochgerechneten Leistungen hätte gestrichen werden dürfen. Die auch insoweit rechtswidrige Vorgehensweise des Beklagten wird exemplarisch belegt durch die Kürzung bei der Leistung Nr 4417 EBM-Ä. Auf der Grundlage der Hochrechnung wurden hier 1.847 Ansätze der Leistung als unwirtschaftlich erkannt. Diese hatte der Kläger insgesamt 3.837 mal abgerechnet. Hiervon setzte die KÄV in Anwendung des Regelwerkes 3.063 Leistungen ab, sodass dem Kläger noch der Ansatz von 774 Leistungen verblieb. Ausgehend von einer als unwirtschaftlich erkannten Quote von ca 50 % hätten die verbleibenden Leistungen auch nur in diesem Umfang gekürzt werden dürfen. Unter Zugrundelegung der nach der Hochrechnung als unwirtschaftlich erkannten 1.847 Leistungsansätze hat der Beklagte jedoch – im Widerspruch zu seinen eigenen Festlegungen in Höhe eines nur 50 %igen unwirtschaftlichen Ansatzes – alle 774 verbliebenen Leistungen nach Nr 4417 EBM-Ä als unwirtschaftlich gekürzt.
Der Beklagte hat die im Einzelnen aufgeführten Vorgaben hinsichtlich der Auswahl der Prüfmethode und der konkreten Durchführung einer gegebenenfalls statthaften repräsentativen Einzelfallprüfung mit anschließender Hochrechnung nicht beachtet. Sein Bescheid ist daher aufzuheben. Er wird nunmehr unter Beachtung der Rechtsauffassung des Senats erneut über den Widerspruch des Klägers gegen den Prüfbescheid vom 29. Februar 2000 zu entscheiden haben.
Die Kostenentscheidung beruht auf § 197a Abs 1 Satz 1 SGG iVm §§ 154 ff Verwaltungsgerichtsordnung (VwGO). Danach trägt der unterlegene Beklagte die Kosten des Verfahrens in allen Instanzen (§ 154 Abs 1 VwGO). Eine Aufteilung der Kosten des Revisionsverfahrens gemäß § 155 Abs 2 VwGO ist nicht erforderlich, obwohl der Kläger hier zunächst – erstmals – eine vollständige Aufhebung des Widerspruchsbescheids beantragt, sich später aber auf einen Bescheidungsantrag beschränkt hat (§ 99 Abs 3 Nr 2 SGG). Denn der in Verfahren der Wirtschaftlichkeitsprüfung aus prozessualen Gründen zweckmäßige Bescheidungsantrag ändert nichts daran, dass das wirtschaftliche Interesse des Vertragsarztes regelmäßig auf die Beseitigung der Honorarkürzungen abzielt (vgl Wenner/Bernard, NZS 2003, 568, 572), sodass der Streitwert auch bei einem solchen Antrag den vollen Kürzungsbetrag umfasst. Dementsprechend hat die nachträgliche Beschränkung des Revisionsbegehrens auf eine Neubescheidung auch bei der Kostengrundentscheidung keine Auswirkungen; der Kläger muss deshalb auch keinen Bruchteil der Kosten für das Revisionsverfahren tragen. Die Beigeladenen können keine Kostenerstattung beanspruchen, da sie keine Anträge gestellt haben (§ 162 Abs 3 VwGO).
Fundstellen
Haufe-Index 1403400 |
ArztR 2006, 99 |
GuS 2005, 55 |